أدخلت OpenAI تحديثاً مهماً على وضع الصوت في ChatGPT، حيث أصبح بإمكان المستخدمين إجراء محادثات صوتية مباشرة داخل نافذة الدردشة المعتادة دون الحاجة للانتقال إلى واجهة منفصلة أو وضع خاص. يهدف هذا التغيير إلى جعل التفاعل بالصوت جزءاً طبيعياً من استخدام النموذج، مع دمج النص والصور والخرائط والمحتوى المرئي في تجربة واحدة سلسة.
كيف تعمل ميزة الصوت داخل الدردشة؟
عند الضغط على أيقونة الميكروفون داخل المحادثة، يبدأ ChatGPT في استقبال الكلام وتحويله إلى نص يظهر ضمن سياق الدردشة مثل أي رسالة أخرى. يمكن للمستخدم الانتقال بحرية بين التحدث والكتابة، ومتابعة الرسائل السابقة، ما يجعل سجل الحوار الصوتي والنصي محفوظاً في مكان واحد.
من المهم الانتباه إلى أن الاستماع يستمر إلى أن يقوم المستخدم بإيقاف الميكروفون يدوياً، إذ لا يوجد إيقاف تلقائي بعد فترة من الخمول، الأمر الذي قد يسبب إزعاجاً لمن ينسون إيقاف التسجيل.
عرض المحتوى المرئي أثناء المحادثة
يتيح التحديث الجديد إظهار عناصر مرئية أثناء المكالمة، مثل الصور والأيقونات وبطاقات المعلومات وحالة الطقس، وأحياناً الخرائط التفاعلية. تعتمد الخرائط على خدمات خارجية، لذلك قد لا تعمل بنفس الكفاءة في جميع الدول، وقد تختلف النتائج الفعلية عن العروض التوضيحية التي يشاهدها المستخدمون في مقاطع العرض.
مع ذلك، فإن الجمع بين الصوت والمحتوى المرئي في وقت واحد يوفر تجربة ملائمة لمن يعملون مع معلومات معقدة، مثل التخطيط للرحلات أو فهم بيانات تقنية.
النماذج المستخدمة في وضع الصوت
تستند المحادثات النصية العادية في ChatGPT إلى نموذج GPT‑5.1، وهو من أقوى النماذج التي توفرها OpenAI حالياً للكتابة والتحليل النصي المتقدم. في المقابل، يعتمد وضع الصوت على نموذج GPT‑4o المصمم خصيصاً للتفاعل الصوتي والمعالجة الفورية، مع إمكانية استخدام نسخة GPT‑4o mini للمشتركين المدفوعين عند الاستخدام المكثف. هذا يعني أن جودة الإجابات في الدردشة النصية قد تكون أعلى بقليل من تلك المقدمة في الجلسات الصوتية المستمرة، رغم أن التجربة تظل متقدمة في الحالتين.
لمن تصلح هذه الميزة؟
تخدم ميزة الصوت داخل نافذة الدردشة المستخدمين الذين يودون الجمع بين سرعة الحديث ودقة النص المكتوب في آن واحد، دون التنقل بين واجهات مختلفة.
يمكن أن تكون مفيدة بشكل خاص في الحالات التالية:
- التخطيط للسفر مع عرض خريطة أو معلومات إضافية أثناء الحديث.
- تعلم اللغات من خلال المحادثة الصوتية مع رؤية التصحيحات مكتوبة.
- الطبخ أو المهام العملية عند انشغال اليدين، مع متابعة التعليمات صوتياً ونصياً.
- استخدام برامج العمل وشرح المشكلة صوتياً بينما يظهر الشرح والتصحيح في النص.
من يفضّلون تجربة صوتية منفصلة بالكامل قد يفضلون الاستمرار في استخدام الواجهة التقليدية القديمة، إذ يمكن العودة إلى وضع الصوت المستقل من إعدادات ChatGPT في أي وقت.
التوفر والخيارات الإضافية
يُطرح التحديث لمستخدمي ChatGPT على الويب وعلى تطبيقات الهاتف، سواء في النسخة المجانية أو المدفوعة، مع إتاحة استخدام الصوت مجاناً للجميع. يحصل المستخدم المجاني على نسخة محدودة من قدرات الوضع الصوتي، في حين يتمتع المشتركون في الخطط المميزة والاحترافية بإمكانيات إضافية مثل التقاط الصور أثناء المحادثة أو مشاركة الشاشة أو إتاحة رؤية البيئة المحيطة من خلال الكاميرا. هذه الخصائص تعزز استخدام ChatGPT في سيناريوهات مثل الدعم الفني أو شرح الشيفرات البرمجية خطوة بخطوة.
الصوت كجزء من تجربة ChatGPT
يعكس دمج الصوت في نافذة الدردشة العادية توجهاً واضحاً نحو جعل التفاعل الصوتي جزءاً أساسياً من تجربة ChatGPT، وليس مجرد إضافة جانبية. الجمع بين الكلام والنص والعناصر البصرية في سياق واحد يقلل من تعقيد الاستخدام، رغم استمرار الحاجة إلى تحسينات مثل استقرار إظهار الخرائط وآلية الإيقاف التلقائي للميكروفون. في المحصلة، يمنح هذا التحديث المستخدم حرية المزج بين الصوت والنص بحسب تفضيله، بدلاً من الاختيار القسري بينهما.