دیپ مایند عکس دو بعدی را به سه بعدی تبدیل می‌کند

منتشر شده در 11 تیر 1397

دیپ‌مایند که زیر نظر گوگل فعالیت می‌کند در حال توسعه‌ی هوش مصنوعی جدیدی است که می‌تواند با بررسی تصاویر دوبعدی از آن‌ها تصویر سه‌بعدی بسازد. شرکت DeepMind که از شرکت‌های زیر شاخه‌ی گوگلاست، به‌تازگی نوعی هوش مصنوعی را توسعه داده است که می‌تواند پس از مشاهده‌ی تصاویر به صورت دوبعدی، آن‌ها را به حالت سه‌بعدی تبدیل کند. محققان هوش مصنوعی همواره در تلاش هستند تا یادگیری ماشین را هرچه بیشتر به یادگیری انسان نزدیک کنند. همه‌ی انسان‌ها وقتی به پیرامون خود می‌نگرند، بدون اینکه تمام مشخصات اطراف را بدانند، می‌توانند آن ابعاد را حدس زده و براساس این مفروضات به درک محیط اطراف بپردازند. یعنی مثلا اگر به سینه‌ی کسی نگاه کنیم، این استنباط را خواهیم داشت که این شخص کمر هم دارد؛ هرچند که کمر او در دید ما نباشد.

مثال دیگر این‌که وقتی با کودکی بازی می‌کنید و دست خود را روی صورت گذاشته و برمی‌دارید، کودک می‌داند که صورت همواره سر جای خود وجود دارد، هرچند که شما آن را با دست بپوشانید. این همان سازوکاری است که تیم دیپ‌مایند در ماشین‌های خود به کار گرفته‌اند. آن‌ها هوش مصنوعی را طوری تعلیم دادند که بتواند حدس بزند که اشیا از زوایای مختلفی که تا کنون ندیده است چگونه به نظر می‌رسند.

دانشمندان DeepMind به نوعی شبکه‌ی جستجوی مولد (Generative Query Network) دست یافته‌اند که در آن شبکه‌ی عصبی به هوش مصنوعی آموزش می‌دهد که چطور یک شیء را از زاویه‌ای دیگر تصور کند. طرز کار به این شکل است که AI یا هوش مصنوعی تصاویر مسطح و دوبعدی را مورد مشاهده و بررسی قرار داده و سعی می‌کند آن‌ها را بازآفرینی کند. نکته‌ای که در این روند حائز اهمیت است عدم استفاده‌ی هوش مصنوعی از داده‌های ورودی پیشین و دانش قبلی است. یعنی سیستم فقط سه تصویر از یک شیء را می‌بیند و بر همان اساس حدس می‌زند که نسخه‌ی سه‌بعدی صحنه چه خواهد بود.

تصور کنید از یک مکعب عکس گرفته‌اید و از هوش مصنوعی می‌خواهید همان تصویر را از زوایای مختلف پردازش کند. مواردی مانند نور و سایه‌ها و جهت اضلاعی که مکعب را تشکیل داده‌اند، تغییر خواهد کرد. هوش مصنوعی با استفاده از الگوریتم جستجوی مولد (GQN) برای رندر کردن تصویر مورد بحث باید آن را از زوایایی که هرگز ندیده است تصور کند.

این پروژه می‌تواند به درک تصویر هوش مصنوعی بدون دخالت انسان منتج شود‌. در حال حاضر، این سیستم توسط تصاویر دنیای واقعی تعلیم داده نشده است؛ بنابراین، گام بعدی رندر کردن صحنه‌های واقعی گرفته‌شده توسط عکاسان است.

این احتمال وجود دارد که در آینده، هوش مصنوعی مبتنی بر GQN متعلق به شرکت دیپ‌مایند بتواند صرفا با استفاده از چند عکس، صحنه‌هایی سه‌بعدی با شباهت بسیار زیاد به دنیای واقعی خلق کند.

برای دیدن دیگر ویدئو های ارسالی اینجا کلیک کنید

دیدگاه کاربران

ویدیو بعدی

پخش خودکار بعدی

ویدیو مشابه دیگری پیدا نشد.