دیپمایند که زیر نظر گوگل فعالیت میکند در حال توسعهی هوش مصنوعی جدیدی است که میتواند با بررسی تصاویر دوبعدی از آنها تصویر سهبعدی بسازد. شرکت DeepMind که از شرکتهای زیر شاخهی گوگلاست، بهتازگی نوعی هوش مصنوعی را توسعه داده است که میتواند پس از مشاهدهی تصاویر به صورت دوبعدی، آنها را به حالت سهبعدی تبدیل کند. محققان هوش مصنوعی همواره در تلاش هستند تا یادگیری ماشین را هرچه بیشتر به یادگیری انسان نزدیک کنند. همهی انسانها وقتی به پیرامون خود مینگرند، بدون اینکه تمام مشخصات اطراف را بدانند، میتوانند آن ابعاد را حدس زده و براساس این مفروضات به درک محیط اطراف بپردازند. یعنی مثلا اگر به سینهی کسی نگاه کنیم، این استنباط را خواهیم داشت که این شخص کمر هم دارد؛ هرچند که کمر او در دید ما نباشد.
مثال دیگر اینکه وقتی با کودکی بازی میکنید و دست خود را روی صورت گذاشته و برمیدارید، کودک میداند که صورت همواره سر جای خود وجود دارد، هرچند که شما آن را با دست بپوشانید. این همان سازوکاری است که تیم دیپمایند در ماشینهای خود به کار گرفتهاند. آنها هوش مصنوعی را طوری تعلیم دادند که بتواند حدس بزند که اشیا از زوایای مختلفی که تا کنون ندیده است چگونه به نظر میرسند.
دانشمندان DeepMind به نوعی شبکهی جستجوی مولد (Generative Query Network) دست یافتهاند که در آن شبکهی عصبی به هوش مصنوعی آموزش میدهد که چطور یک شیء را از زاویهای دیگر تصور کند. طرز کار به این شکل است که AI یا هوش مصنوعی تصاویر مسطح و دوبعدی را مورد مشاهده و بررسی قرار داده و سعی میکند آنها را بازآفرینی کند. نکتهای که در این روند حائز اهمیت است عدم استفادهی هوش مصنوعی از دادههای ورودی پیشین و دانش قبلی است. یعنی سیستم فقط سه تصویر از یک شیء را میبیند و بر همان اساس حدس میزند که نسخهی سهبعدی صحنه چه خواهد بود.
تصور کنید از یک مکعب عکس گرفتهاید و از هوش مصنوعی میخواهید همان تصویر را از زوایای مختلف پردازش کند. مواردی مانند نور و سایهها و جهت اضلاعی که مکعب را تشکیل دادهاند، تغییر خواهد کرد. هوش مصنوعی با استفاده از الگوریتم جستجوی مولد (GQN) برای رندر کردن تصویر مورد بحث باید آن را از زوایایی که هرگز ندیده است تصور کند.
این پروژه میتواند به درک تصویر هوش مصنوعی بدون دخالت انسان منتج شود. در حال حاضر، این سیستم توسط تصاویر دنیای واقعی تعلیم داده نشده است؛ بنابراین، گام بعدی رندر کردن صحنههای واقعی گرفتهشده توسط عکاسان است.
این احتمال وجود دارد که در آینده، هوش مصنوعی مبتنی بر GQN متعلق به شرکت دیپمایند بتواند صرفا با استفاده از چند عکس، صحنههایی سهبعدی با شباهت بسیار زیاد به دنیای واقعی خلق کند.
برای دیدن دیگر ویدئو های ارسالی اینجا کلیک کنید