دستیار مجازی اپل، سیری، کار خود را برای رسیدن به رقبا انجام داده است. در اینجا نحوه تکامل سیری در دنیایی با چت ربات های درخشان با هوش مصنوعی است. ما در حال حاضر در دنیایی زندگی میکنیم که دستیاران مجازی میتوانند در یک مکالمه بیوقفه (و حتی معاشقه) با مردم شرکت کنند. اما دستیار مجازی اپل، سیری، با برخی از اصول اولیه مشکل دارد.
به عنوان مثال، من از سیری پرسیدم که المپیک امسال چه زمانی برگزار می شود و او به سرعت تاریخ های صحیح بازی های تابستانی را مشخص کرد. وقتی آن را با «افزودن آن به تقویمم» پیگیری کردم، دستیار مجازی بهطور ناقص پاسخ داد: «آن را چه نامی بگذارم؟» پاسخ این سوال برای ما انسان ها واضح است. دستیار مجازی اپل گم شد. حتی وقتی پاسخ دادم “المپیک”، سیری پاسخ داد، “برای چه زمانی باید برنامه ریزی کنم؟”
سیری تمایل به تزلزل دارد زیرا فاقد آگاهی زمینه ای است، که توانایی آن را برای دنبال کردن مکالمه مانند یک انسان محدود می کند. این می تواند در اوایل 10 ژوئن، اولین روز کنفرانس سالانه توسعه دهندگان در سراسر جهان اپل (WWDC) تغییر کند. انتظار میرود که سازنده آیفون بهروزرسانیهای بزرگی را با سیستمعامل موبایلی آینده خود که احتمالاً iOS 18 نامیده میشود، با تغییرات قابل توجهی برای سیری رونمایی کند.
دستیار مجازی اپل زمانی که در سال 2011 با iPhone 4S معرفی شد، موجی از آن را ایجاد کرد. برای اولین بار، مردم می توانستند با تلفن های خود صحبت کنند و پاسخی شبیه به انسان دریافت کنند. برخی از تلفنهای اندرویدی قبل از سیری، جستجوی صوتی و اقدامات صوتی اولیه را ارائه میکردند، اما آنها بیشتر مبتنی بر دستور بودند و به طور گستردهای در نظر گرفته میشد که کمتر بصری هستند.
به این ترتیب، سیری جهشی را در تعامل مبتنی بر صدا نشان داد و زمینه را برای دستیارهای صوتی بعدی مانند الکسای آمازون، دستیار گوگل و حتی ChatGPT OpenAI و چت ربات های جمینی گوگل فراهم کرد.
روی سیری حرکت کنید، دستیارهای چندوجهی اینجا هستند
اگرچه سیری در سال 2011 مردم را با تجربه مبتنی بر صدا تحت تأثیر قرار داد، اما برخی قابلیتهای آن را از همتایان خود عقبتر میدانند. الکسا و دستیار گوگل در درک و پاسخگویی به سوالات ماهر هستند و هر دو به روش های متفاوتی نسبت به سیری در خانه های هوشمند گسترش یافته اند. فقط به نظر می رسد که سیری از پتانسیل کامل خود استفاده نکرده است — رقبای آن نیز انتقادات مشابهی را دریافت کرده اند.
در سال 2024، همچنین با یک چشمانداز رقابتی کاملاً متفاوت روبرو است که توسط هوش مصنوعی مولد سوپرشارژ شده است. در هفتههای اخیر، OpenAI، گوگل و مایکروسافت از موج جدیدی از دستیارهای مجازی آیندهنگر با قابلیتهای چندوجهی رونمایی کردهاند که تهدیدی رقابتی برای سیری محسوب میشود. به گفته اسکات گالووی، استاد دانشگاه نیویورک در قسمت اخیر پادکست خود، این بهروزرسانیهای اخیر، قاتلان الکسا و سیری هستند.
اوایل این ماه، OpenAI از جدیدترین مدل هوش مصنوعی خود رونمایی کرد. این اعلامیه نشان میدهد که دستیاران مجازی تا چه حد پیشرفت کردهاند. OpenAI در دموی خود در سانفرانسیسکو نشان داد که چگونه GPT-4o میتواند مکالمات دو طرفه را به روشهای انسانمانندتر انجام دهد، با توانایی ایجاد لحن، بیان سخنان کنایهآمیز، صحبت کردن با زمزمه و حتی معاشقه. این به سرعت با شخصیت اسکارلت جوهانسون در درام هالیوودی او در سال 2013 مقایسه شد که در آن یک نویسنده تنها عاشق دستیار مجازی زن خود با صدای جوهانسون می شود. پس از دموی GPT-4o، این بازیگر آمریکایی OpenAI را متهم کرد که بدون اجازه او صدای دستیار مجازی ساخته است که به نظر “وحشتناک” شبیه صدای خودش است.
این جنجال ظاهراً برخی از ویژگیهای GPT4o مانند قابلیتهای چندوجهی بومی آن را تغییر داد، به این معنی که مدل هوش مصنوعی میتواند ورودیهای فراتر از متن، شامل تصاویر، زبان گفتاری و حتی ویدیو را درک کند و به آن پاسخ دهد. در عمل، GPT-4o میتواند درباره عکسی که نشان میدهید (با آپلود رسانه) با شما چت کند، آنچه را که در یک کلیپ ویدیویی اتفاق میافتد توصیف کند و درباره یک مقاله خبری بحث کند.
یک روز پس از پیش نمایش OpenAI، گوگل نسخه ی نمایشی چندوجهی خود را به نمایش گذاشت و از Project Astra پرده برداری کرد — نمونه اولیه ای که این شرکت آن را به عنوان “آینده دستیاران هوش مصنوعی” معرفی کرده است. در یک ویدیوی نمایشی، گوگل توضیح داد که چگونه کاربران می توانند با استفاده از دوربین گوشی هوشمند خود، محیط اطراف خود را به دستیار مجازی گوگل نشان دهند و سپس به بحث درباره اشیاء موجود در محیط خود ادامه دهند. به عنوان مثال، فردی که با Astra در محل احتمالاً دفتر گوگل در لندن تعامل داشت، از دستیار مجازی گوگل خواست تا شیئی را که در اتاق صدا تولید می کند، شناسایی کند. آسترا در پاسخ به سخنراني كه روي ميز نشسته بود اشاره كرد.
نمونه اولیه Astra گوگل نه تنها می تواند محیط اطراف خود را معنا کند، بلکه می تواند جزئیات مربوط به آن را نیز به خاطر بسپارد. وقتی راوی پرسید که عینکهایشان را کجا گذاشتهاند، آسترا با پاسخ به این جمله: «در گوشه میز کنار یک سیب قرمز» توانست به کاربر بگوید آخرین بار کجا دیده شدهاند.
رقابت برای ایجاد دستیارهای مجازی پر زرق و برق به OpenAI و گوگل ختم نمی شود. طبق اسناد توسعه دهندگان عمومی، شرکت هوش مصنوعی ایلان ماسک، xAI، در حال پیشرفت در تبدیل ربات چت Grok خود به یک ربات با قابلیت های چندوجهی است. در ماه مه، آمازون اعلام کرد که در حال کار بر روی دستیار مجازی چند دهه ای الکسا است که یک ارتقاء هوش مصنوعی مولد را ارائه می کند.
آیا سیری چند وجهی خواهد شد؟
چت رباتهای مکالمه چندوجهی در حال حاضر نشاندهنده برتری دستیاران هوش مصنوعی هستند و به طور بالقوه پنجرهای را به آینده درباره نحوه حرکت ما در تلفنها و سایر دستگاهها ارائه میدهند.
اپل هنوز دستیار دیجیتالی با قابلیت های چندوجهی ندارد که خود را نشان دهد و آن را پشت سر منحنی قرار دهد. سازنده آیفون تحقیقاتی در این زمینه منتشر کرده است. در ماه اکتبر، Ferret را معرفی کرد، یک مدل هوش مصنوعی چندوجهی که می تواند آنچه را که روی صفحه گوشی شما اتفاق می افتد درک کند و طیف وسیعی از وظایف را بر اساس آنچه می بیند انجام دهد. در این مقاله، محققان به بررسی این موضوع می پردازند که چگونه می تواند آنچه را که به آن نگاه می کنید شناسایی و گزارش دهد و در کنار سایر قابلیت ها به شما کمک کند تا از برنامه ها عبور کنید. این تحقیق به آینده ای احتمالی اشاره می کند که در آن نحوه استفاده ما از آیفون و سایر دستگاه ها کاملاً تغییر می کند.
جایی که اپل می تواند متمایز شود از نظر حریم خصوصی است. به گفته نیویورک تایمز، سازنده آیفون مدتهاست که از حفظ حریم خصوصی به عنوان یک ارزش اصلی در هنگام طراحی محصولات و خدمات دفاع میکند و نسخه جدید سیری را بهعنوان یک جایگزین خصوصیتر برای رقبای خود در نظر میگیرد. طبق گزارش وال استریت ژورنال، انتظار میرود اپل با پردازش درخواستهای سیری روی دستگاه و روی آوردن به ابر برای کارهای پیچیدهتر به این مهم دست یابد، اما این درخواستها در مراکز داده با تراشههای ساخت اپل پردازش میشوند.
طبق گفته بلومبرگ، در مورد چت بات، اپل در آستانه نهایی کردن قرارداد با OpenAI برای آوردن ChatGPT به آیفون است، که نشانه احتمالی این است که سیری مستقیماً با ChatGPT یا Gemini رقابت نخواهد کرد. به گفته نیویورک تایمز، سیری به جای انجام کارهایی مانند نوشتن شعر، کارهایی را که قبلاً می تواند انجام دهد، انجام می دهد و در آنها بهتر می شود.
سیری چگونه تغییر خواهد کرد؟ همه نگاه ها به WWDC اپل است
اپل عمداً در آمدن به بازار کند بوده است و معمولاً رویکرد انتظار و دید را در مورد فناوری نوظهور ترجیح می دهد. این استراتژی اغلب جواب داده است، اما نه همیشه. به عنوان مثال، iPad اولین تبلت نبود، اما برای بسیاری از جمله ویرایشگران CNET، بهترین تبلت است. از سوی دیگر، اسپیکر هوشمند هوم پاد اپل تنها چندین سال پس از آمازون اکو و گوگل هوم وارد بازار شد، اما هرگز نتوانست به سهم بازار رقبای خود برسد. یک مثال جدیدتر در بخش سخت افزاری گوشی های تاشو هستند. اپل تنها نگهدارنده اصلی است. هر رقیب اصلی، گوگل، سامسونگ، آنر، هواوی و حتی شرکت های کمتر شناخته شده ای مانند فانتوم، اپل را شکست دادند.
Avi Greengart، تحلیلگر ارشد Techsponential میگوید: از لحاظ تاریخی، اپل رویکرد بهروزرسانی سیری را در فواصل زمانی در پیش گرفته است.
گرینگارت میگوید: «اپل همیشه بیشتر از آمازون، گوگل یا حتی سامسونگ درباره سیری برنامهریزی کرده است. به نظر میرسد که اپل دانش را به صورت دستهای به سیری اضافه میکند – یک سال ورزش، سال بعد سرگرمی.
با سیری، به طور گسترده انتظار می رود اپل امسال به جای ایجاد فضای جدید، به بازی catchup بپردازد. با این حال، سیری احتمالاً تمرکز اصلی سیستم عامل آینده اپل، iOS 18 خواهد بود، که شایعه شده است که ویژگی های هوش مصنوعی جدیدی را به همراه خواهد داشت. به گزارش بلومبرگ، انتظار میرود اپل ادغامهای بیشتر هوش مصنوعی را در برنامهها و ویژگیهای موجود از جمله یادداشتها، ایموجیها، ویرایش عکس، پیامها و ایمیلها نشان دهد.
در مورد سیری، انتظار میرود که امسال به یک کمککننده دیجیتالی هوشمندتر تبدیل شود. طبق گزارش پاورآن، خبرنامه بلومبرگ مارک گورمن، اپل ظاهراً دستیار صوتی خود را بر روی مدلهای زبان بزرگ آموزش میدهد تا توانایی خود را در پاسخگویی به سؤالات با دقت و پیچیدگی بیشتر بهبود بخشد.
ادغام مدلهای زبان بزرگ، و همچنین فناوری پشت ChatGPT، آماده است تا سیری را به یک دستیار مجازی آگاهتر و قدرتمندتر تبدیل کند. سیری را قادر میسازد تا سؤالات پیچیدهتر و ظریفتری را درک کند، اما پاسخهای دقیقتری نیز ارائه دهد. طبق گزارش نیویورک تایمز، انتظار میرود سری آیفون 16 امسال با حافظه بزرگتری برای پشتیبانی از قابلیتهای جدید سیری عرضه شود.
گرینگارت به CNET گفت: «امید من این است که اپل بتواند از هوش مصنوعی مولد استفاده کند تا به سیری این توانایی را بدهد که بیشتر شبیه دستیار متفکری باشد که میفهمد چه میخواهید بپرسید، اما از سیستمهای مبتنی بر داده برای پاسخهایی که به دادهها محدود میشوند، استفاده کند.
سیری همچنین می تواند در انجام وظایف چند مرحله ای بهبود یابد. گزارش سپتامبر توسط Information جزئیات چگونگی پاسخ Siri به دستورات صوتی ساده برای کارهای پیچیده تر، مانند تبدیل مجموعه ای از عکس ها به GIF و سپس ارسال آنها به یکی از مخاطبین شما را شرح می دهد. این یک گام مهم رو به جلو در قابلیت های سیری خواهد بود.
گرینگارت میگوید: «اپل همچنین نحوه عملکرد برنامههای آیفون را تعریف میکند، بنابراین این توانایی را دارد که به سیری اجازه دهد تا با اجازه توسعهدهنده در بین برنامهها کار کند – به طور بالقوه قابلیتهای جدیدی را برای سیری باهوشتر برای انجام ایمن وظایف از طرف شما باز میکند.
چقدر این پست مفید بود؟
روی یک ستاره کلیک کنید تا به آن امتیاز دهید!
میانگین امتیاز 0 / 5. تعداد آرا: 0
تا الان رای نیامده! اولین نفری باشید که به این پست امتیاز می دهید.