آیا سیری اپل بیشتر شبیه ChatGPT خواهد شد؟

آیا سیری بیشتر شبیه ChatGPT خواهد شد؟

دستیار مجازی اپل، سیری، کار خود را برای رسیدن به رقبا انجام داده است. در اینجا نحوه تکامل سیری در دنیایی با چت ربات های درخشان با هوش مصنوعی است. ما در حال حاضر در دنیایی زندگی می‌کنیم که دستیاران مجازی می‌توانند در یک مکالمه بی‌وقفه (و حتی معاشقه) با مردم شرکت کنند. اما دستیار مجازی اپل، سیری، با برخی از اصول اولیه مشکل دارد.

به عنوان مثال، من از سیری پرسیدم که المپیک امسال چه زمانی برگزار می شود و او به سرعت تاریخ های صحیح بازی های تابستانی را مشخص کرد. وقتی آن را با «افزودن آن به تقویمم» پیگیری کردم، دستیار مجازی به‌طور ناقص پاسخ داد: «آن را چه نامی بگذارم؟» پاسخ این سوال برای ما انسان ها واضح است. دستیار مجازی اپل گم شد. حتی وقتی پاسخ دادم “المپیک”، سیری پاسخ داد، “برای چه زمانی باید برنامه ریزی کنم؟”

سیری تمایل به تزلزل دارد زیرا فاقد آگاهی زمینه ای است، که توانایی آن را برای دنبال کردن مکالمه مانند یک انسان محدود می کند. این می تواند در اوایل 10 ژوئن، اولین روز کنفرانس سالانه توسعه دهندگان در سراسر جهان اپل (WWDC) تغییر کند. انتظار می‌رود که سازنده آیفون به‌روزرسانی‌های بزرگی را با سیستم‌عامل موبایلی آینده خود که احتمالاً iOS 18 نامیده می‌شود، با تغییرات قابل توجهی برای سیری رونمایی کند.

دستیار مجازی اپل زمانی که در سال 2011 با iPhone 4S معرفی شد، موجی از آن را ایجاد کرد. برای اولین بار، مردم می توانستند با تلفن های خود صحبت کنند و پاسخی شبیه به انسان دریافت کنند. برخی از تلفن‌های اندرویدی قبل از سیری، جستجوی صوتی و اقدامات صوتی اولیه را ارائه می‌کردند، اما آن‌ها بیشتر مبتنی بر دستور بودند و به طور گسترده‌ای در نظر گرفته می‌شد که کمتر بصری هستند.

به این ترتیب، سیری جهشی را در تعامل مبتنی بر صدا نشان داد و زمینه را برای دستیارهای صوتی بعدی مانند الکسای آمازون، دستیار گوگل و حتی ChatGPT OpenAI و چت ربات های جمینی گوگل فراهم کرد.

روی سیری حرکت کنید، دستیارهای چندوجهی اینجا هستند

اگرچه سیری در سال 2011 مردم را با تجربه مبتنی بر صدا تحت تأثیر قرار داد، اما برخی قابلیت‌های آن را از همتایان خود عقب‌تر می‌دانند. الکسا و دستیار گوگل در درک و پاسخگویی به سوالات ماهر هستند و هر دو به روش های متفاوتی نسبت به سیری در خانه های هوشمند گسترش یافته اند. فقط به نظر می رسد که سیری از پتانسیل کامل خود استفاده نکرده است — رقبای آن نیز انتقادات مشابهی را دریافت کرده اند.

در سال 2024، همچنین با یک چشم‌انداز رقابتی کاملاً متفاوت روبرو است که توسط هوش مصنوعی مولد سوپرشارژ شده است. در هفته‌های اخیر، OpenAI، گوگل و مایکروسافت از موج جدیدی از دستیارهای مجازی آینده‌نگر با قابلیت‌های چندوجهی رونمایی کرده‌اند که تهدیدی رقابتی برای سیری محسوب می‌شود. به گفته اسکات گالووی، استاد دانشگاه نیویورک در قسمت اخیر پادکست خود، این به‌روزرسانی‌های اخیر، قاتلان الکسا و سیری هستند.

  توافق شرکت‌ها بر سر حفظ ایمنی هوش مصنوعی

اوایل این ماه، OpenAI از جدیدترین مدل هوش مصنوعی خود رونمایی کرد. این اعلامیه نشان می‌دهد که دستیاران مجازی تا چه حد پیشرفت کرده‌اند. OpenAI در دموی خود در سانفرانسیسکو نشان داد که چگونه GPT-4o می‌تواند مکالمات دو طرفه را به روش‌های انسان‌مانندتر انجام دهد، با توانایی ایجاد لحن، بیان سخنان کنایه‌آمیز، صحبت کردن با زمزمه و حتی معاشقه. این به سرعت با شخصیت اسکارلت جوهانسون در درام هالیوودی او در سال 2013 مقایسه شد که در آن یک نویسنده تنها عاشق دستیار مجازی زن خود با صدای جوهانسون می شود. پس از دموی GPT-4o، این بازیگر آمریکایی OpenAI را متهم کرد که بدون اجازه او صدای دستیار مجازی ساخته است که به نظر “وحشتناک” شبیه صدای خودش است.

این جنجال ظاهراً برخی از ویژگی‌های GPT4o مانند قابلیت‌های چندوجهی بومی آن را تغییر داد، به این معنی که مدل هوش مصنوعی می‌تواند ورودی‌های فراتر از متن، شامل تصاویر، زبان گفتاری و حتی ویدیو را درک کند و به آن پاسخ دهد. در عمل، GPT-4o می‌تواند درباره عکسی که نشان می‌دهید (با آپلود رسانه) با شما چت کند، آنچه را که در یک کلیپ ویدیویی اتفاق می‌افتد توصیف کند و درباره یک مقاله خبری بحث کند.

یک روز پس از پیش نمایش OpenAI، گوگل نسخه ی نمایشی چندوجهی خود را به نمایش گذاشت و از Project Astra پرده برداری کرد — نمونه اولیه ای که این شرکت آن را به عنوان “آینده دستیاران هوش مصنوعی” معرفی کرده است. در یک ویدیوی نمایشی، گوگل توضیح داد که چگونه کاربران می توانند با استفاده از دوربین گوشی هوشمند خود، محیط اطراف خود را به دستیار مجازی گوگل نشان دهند و سپس به بحث درباره اشیاء موجود در محیط خود ادامه دهند. به عنوان مثال، فردی که با Astra در محل احتمالاً دفتر گوگل در لندن تعامل داشت، از دستیار مجازی گوگل خواست تا شیئی را که در اتاق صدا تولید می کند، شناسایی کند. آسترا در پاسخ به سخنراني كه روي ميز نشسته بود اشاره كرد.

نمونه اولیه Astra گوگل نه تنها می تواند محیط اطراف خود را معنا کند، بلکه می تواند جزئیات مربوط به آن را نیز به خاطر بسپارد. وقتی راوی پرسید که عینک‌هایشان را کجا گذاشته‌اند، آسترا با پاسخ به این جمله: «در گوشه میز کنار یک سیب قرمز» توانست به کاربر بگوید آخرین بار کجا دیده شده‌اند.

رقابت برای ایجاد دستیارهای مجازی پر زرق و برق به OpenAI و گوگل ختم نمی شود. طبق اسناد توسعه دهندگان عمومی، شرکت هوش مصنوعی ایلان ماسک، xAI، در حال پیشرفت در تبدیل ربات چت Grok خود به یک ربات با قابلیت های چندوجهی است. در ماه مه، آمازون اعلام کرد که در حال کار بر روی دستیار مجازی چند دهه ای الکسا است که یک ارتقاء هوش مصنوعی مولد را ارائه می کند.

  دسترسی کاربران ایران به OpenAI مسدود می شود

آیا سیری چند وجهی خواهد شد؟

چت ربات‌های مکالمه چندوجهی در حال حاضر نشان‌دهنده برتری دستیاران هوش مصنوعی هستند و به طور بالقوه پنجره‌ای را به آینده درباره نحوه حرکت ما در تلفن‌ها و سایر دستگاه‌ها ارائه می‌دهند.

اپل هنوز دستیار دیجیتالی با قابلیت های چندوجهی ندارد که خود را نشان دهد و آن را پشت سر منحنی قرار دهد. سازنده آیفون تحقیقاتی در این زمینه منتشر کرده است. در ماه اکتبر، Ferret را معرفی کرد، یک مدل هوش مصنوعی چندوجهی که می تواند آنچه را که روی صفحه گوشی شما اتفاق می افتد درک کند و طیف وسیعی از وظایف را بر اساس آنچه می بیند انجام دهد. در این مقاله، محققان به بررسی این موضوع می پردازند که چگونه می تواند آنچه را که به آن نگاه می کنید شناسایی و گزارش دهد و در کنار سایر قابلیت ها به شما کمک کند تا از برنامه ها عبور کنید. این تحقیق به آینده ای احتمالی اشاره می کند که در آن نحوه استفاده ما از آیفون و سایر دستگاه ها کاملاً تغییر می کند.

جایی که اپل می تواند متمایز شود از نظر حریم خصوصی است. به گفته نیویورک تایمز، سازنده آیفون مدت‌هاست که از حفظ حریم خصوصی به عنوان یک ارزش اصلی در هنگام طراحی محصولات و خدمات دفاع می‌کند و نسخه جدید سیری را به‌عنوان یک جایگزین خصوصی‌تر برای رقبای خود در نظر می‌گیرد. طبق گزارش وال استریت ژورنال، انتظار می‌رود اپل با پردازش درخواست‌های سیری روی دستگاه و روی آوردن به ابر برای کارهای پیچیده‌تر به این مهم دست یابد، اما این درخواست‌ها در مراکز داده با تراشه‌های ساخت اپل پردازش می‌شوند.

طبق گفته بلومبرگ، در مورد چت بات، اپل در آستانه نهایی کردن قرارداد با OpenAI برای آوردن ChatGPT به آیفون است، که نشانه احتمالی این است که سیری مستقیماً با ChatGPT یا Gemini رقابت نخواهد کرد. به گفته نیویورک تایمز، سیری به جای انجام کارهایی مانند نوشتن شعر، کارهایی را که قبلاً می تواند انجام دهد، انجام می دهد و در آنها بهتر می شود.

سیری چگونه تغییر خواهد کرد؟ همه نگاه ها به WWDC اپل است

اپل عمداً در آمدن به بازار کند بوده است و معمولاً رویکرد انتظار و دید را در مورد فناوری نوظهور ترجیح می دهد. این استراتژی اغلب جواب داده است، اما نه همیشه. به عنوان مثال، iPad اولین تبلت نبود، اما برای بسیاری از جمله ویرایشگران CNET، بهترین تبلت است. از سوی دیگر، اسپیکر هوشمند هوم پاد اپل تنها چندین سال پس از آمازون اکو و گوگل هوم وارد بازار شد، اما هرگز نتوانست به سهم بازار رقبای خود برسد. یک مثال جدیدتر در بخش سخت افزاری گوشی های تاشو هستند. اپل تنها نگهدارنده اصلی است. هر رقیب اصلی، گوگل، سامسونگ، آنر، هواوی و حتی شرکت های کمتر شناخته شده ای مانند فانتوم، اپل را شکست دادند.

  لیست آیفون‌های سازگار با iOS 18

Avi Greengart، تحلیلگر ارشد Techsponential می‌گوید: از لحاظ تاریخی، اپل رویکرد به‌روزرسانی سیری را در فواصل زمانی در پیش گرفته است.

گرینگارت می‌گوید: «اپل همیشه بیشتر از آمازون، گوگل یا حتی سامسونگ درباره سیری برنامه‌ریزی کرده است. به نظر می‌رسد که اپل دانش را به صورت دسته‌ای به سیری اضافه می‌کند – یک سال ورزش، سال بعد سرگرمی.

با سیری، به طور گسترده انتظار می رود اپل امسال به جای ایجاد فضای جدید، به بازی catchup بپردازد. با این حال، سیری احتمالاً تمرکز اصلی سیستم عامل آینده اپل، iOS 18 خواهد بود، که شایعه شده است که ویژگی های هوش مصنوعی جدیدی را به همراه خواهد داشت. به گزارش بلومبرگ، انتظار می‌رود اپل ادغام‌های بیشتر هوش مصنوعی را در برنامه‌ها و ویژگی‌های موجود از جمله یادداشت‌ها، ایموجی‌ها، ویرایش عکس، پیام‌ها و ایمیل‌ها نشان دهد.

در مورد سیری، انتظار می‌رود که امسال به یک کمک‌کننده دیجیتالی هوشمندتر تبدیل شود. طبق گزارش پاورآن، خبرنامه بلومبرگ مارک گورمن، اپل ظاهراً دستیار صوتی خود را بر روی مدل‌های زبان بزرگ آموزش می‌دهد تا توانایی خود را در پاسخگویی به سؤالات با دقت و پیچیدگی بیشتر بهبود بخشد.

ادغام مدل‌های زبان بزرگ، و همچنین فناوری پشت ChatGPT، آماده است تا سیری را به یک دستیار مجازی آگاه‌تر و قدرتمندتر تبدیل کند. سیری را قادر می‌سازد تا سؤالات پیچیده‌تر و ظریف‌تری را درک کند، اما پاسخ‌های دقیق‌تری نیز ارائه دهد. طبق گزارش نیویورک تایمز، انتظار می‌رود سری آیفون 16 امسال با حافظه بزرگ‌تری برای پشتیبانی از قابلیت‌های جدید سیری عرضه شود.

گرینگارت به CNET گفت: «امید من این است که اپل بتواند از هوش مصنوعی مولد استفاده کند تا به سیری این توانایی را بدهد که بیشتر شبیه دستیار متفکری باشد که می‌فهمد چه می‌خواهید بپرسید، اما از سیستم‌های مبتنی بر داده برای پاسخ‌هایی که به داده‌ها محدود می‌شوند، استفاده کند.

سیری همچنین می تواند در انجام وظایف چند مرحله ای بهبود یابد. گزارش سپتامبر توسط Information جزئیات چگونگی پاسخ Siri به دستورات صوتی ساده برای کارهای پیچیده تر، مانند تبدیل مجموعه ای از عکس ها به GIF و سپس ارسال آنها به یکی از مخاطبین شما را شرح می دهد. این یک گام مهم رو به جلو در قابلیت های سیری خواهد بود.

گرینگارت می‌گوید: «اپل همچنین نحوه عملکرد برنامه‌های آیفون را تعریف می‌کند، بنابراین این توانایی را دارد که به سیری اجازه دهد تا با اجازه توسعه‌دهنده در بین برنامه‌ها کار کند – به طور بالقوه قابلیت‌های جدیدی را برای سیری باهوش‌تر برای انجام ایمن وظایف از طرف شما باز می‌کند.

چقدر این پست مفید بود؟

روی یک ستاره کلیک کنید تا به آن امتیاز دهید!

میانگین امتیاز 0 / 5. تعداد آرا: 0

تا الان رای نیامده! اولین نفری باشید که به این پست امتیاز می دهید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

برای دیدن نوشته هایی که دنبال آن هستید تایپ کنید.