هوش مصنوعی گوگل از تصویر دو بعدی، مدل‌ سه بعدی می‌سازد

دنیای فناوری
منتشر شده در 30 خرداد 1397

گوگل برنامه‌‌ی جدیدی مبتنی بر هوش‌ مصنوعی دیپ‌ مایند (DeepMind) گسترش داده است که اگر تصاویر دوبعدی از اشیاء یا صحنه‌های مختلف به آن داده شود، می‌تواند مدل‌های سه‌بعدی ساده ایجاد کند. البته برخی مواقع ممکن است شیء یا تصویری از یک صحنه، کمی پیچیده باشد؛ ولی برنامه می‌تواند تصاویر مختلفی از زوایای مختلف ارائه دهد.


در اصل برنامه‌ی جدید مبتنی بر هوش مصنوعی (AI) قادر است اشیاء را به‌صورت سه‌بعدی با تعداد اضلاع کم و از زوایای مختلف، در ساختار شبکه‌ای از مسیرها به همراه سایر اشیاء جانبی اعم از کره و تیوب که در صحنه هستند، به‌صورت سه‌بعدی نمایش دهد. این فناوری نوعی بینایی کامپیوتری مبتنی بر شبکه‌های عصبی است و می‌تواند اطلاعات اولیه‌ای از صحنه تهیه کند و سپس بر اساس دانش و اطلاعات اولیه‌ای که دارد، مشاهدات خود را دقیق‌تر و کامل‌تر کkn و سایر اشیاء موجود در صحنه را به تصویر اولیه بیفزاید تا مدلی سه‌بعدی و کامل‌تر ارائه دهد.  


برنامه‌ی جدید مبتنی بر هوش مصنوعی، Network Generation Query نامیده شده است و سعی دارد از طریق سیستم یادگیری عمومی قبل از زمان مقرر، اطلاعاتی در مورد موقعیت فضایی اشیاء ارائه دهد. این برنامه‌ به ما نشان می‌دهد که موقعیت و جایگاه هر شیئی که در تصویر دوبعدی می‌بینیم، در مدل سه‌بعدی به چه صورتی خواهد بود و چه ارتباطی با سایر عناصر تصویر خواهد داشت.


هوش مصنوعی ابتدا تصویری ایزومتریک و هم‌اندازه با تصویر اصلی از صحنه تولید می‌کند و سپس معادل سه‌بعدی آن را به ما نشان می‌دهد. در این فرآیند کلیه اشیاء صحنه مدل‌سازی می‌شوند و پس از آن، قسمت‌هایی که در تصویر دیده نمی‌شوند، نظیر برخی از وجوه اشیاء که در تصویر دوبعدی قابل رؤیت نیستند (مثل اشیائی که پشت دیوار قرار گرفته‌اند یا در گوشه‌ها و لبه‌های تصویر قرار دارند) در مدل سه‌بعدی نشان می‌دهد. برنامه‌ی مبتنی بر هوش مصنوعی هم‌چنین قادر است تصویری از نمای بالا و پایین تصویر دوبعدی تهیه کند و سپس مدل سه‌بعدی شبکه‌ی مسیرها و محیط پیرامون آن را به نمایش بگذارد. با توجه به دانش مبتنی بر هوش مصنوعی و انتظاری که از آن می‌رود، این برنامه آنقدر هوشمند است که نیاز به برچسب زدن اشیاء را در محیط مرتفع می‌سازد و دیگر نیازی نیست نیروی انسانی اشیاء را علامت‌گذاری کند.  



در حال حاضر این فناوری به‌صورت بسیار محدود گسترش یافته است؛ ولی پتانسیل و کارایی بسیار بالایی دارد. برای مثال می‌توان از آن برای طراحی نقشه‌های سه‌بعدی در ناوبری استفاده کرد و یا برای اسکن سه‌بعدی اشیاء از آن کمک گرفت. طبیعتا برنامه‌ی جدید مبتنی بر هوش مصنوعی در خودروهای خودرانکاربرد زیادی خواهد داشت. از آنجایی که برنامه‌ی جدید قدم‌های اولیه‌اش را طی می‌کند، هنوز در پروژه‌های عملی و کاربردی قابل استفاده نیست و زمان بیشتری نیاز دارد تا ارتقاء یابد و در حال حاضر در مسیر کامل‌تر شدن قرار دارد. برخی پروژه‌های دیپ مایند، تا اجرایی شدن در دنیای واقعی فاصله‌ی زیادی را باید طی کنند؛ ولی این فناوری در حال گسترش است و آنقدر به تکامل خواهد رسید که به‌زودی در برخی محصولات گوگل شاهد برخی از انواع خروجی‌ها و کاربردهای آن خواهیم بود.


برای دیدن دیگر ویدئو های ارسالی اینجا کلیک کنید

دیدگاه کاربران