الذكاء الاصطناعي يخطئ نصف الوقت: لماذا لا تثق به في الحقائق؟

مع اعتماد نصف الأمريكيين على الذكاء الاصطناعي للحصول على المعلومات، تكشف دراسات حديثة أن دقة النماذج لا تتجاوز 55% في أفضل الأحوال، مما يضع علامات استفهام حول موثوقية هذه الأدوات في التحقق من الحقائق.

في عالم يزداد اعتماداً على الذكاء الاصطناعي، بات الكثيرون يلجؤون إلى ChatGPT وGemini وClaude للبحث عن إجابات سريعة وموثوقة. لكن بيانات جديدة تكشف أن هذه النماذج ليست دقيقة كما نعتقد، بل قد تكون مخطئة بنسبة تصل إلى النصف. هل يمكننا حقاً الوثوق بالذكاء الاصطناعي في الأمور الجادة؟

لماذا نثق بالذكاء الاصطناعي؟

تشير استطلاعات رأي إلى أن ما يقرب من نصف البالغين في الولايات المتحدة يستخدمون الذكاء الاصطناعي للبحث عن المعلومات وتوليد الأفكار. مع تدهور جودة المحتوى على وسائل التواصل الاجتماعي وتحول محركات البحث إلى بوابات للمنتديات والمزارع المحتوية، أصبحت أدوات الذكاء الاصطناعي تبدو كمنقذ. لكن الواقع مختلف تماماً.

الأرقام تكشف الحقيقة

مدقق الحقائق في مجلة WIRED، وهو محترف متمرس، يصف تجربته مع ميزة AI Overviews من Google قائلاً إنها غير قابلة للاستخدام وتخطئ بنحو ثلث الوقت. وهذه النسبة قد تكون متفائلة جداً. دراسة أجراها مركز Tow Center للصحافة الرقمية في مارس 2025 وجدت أن أكثر من 60% من استجابات محركات البحث المدعومة بالذكاء الاصطناعي كانت غير دقيقة. أما دراسة من BBC فوضعت نسبة الخطأ عند 45%، أي أن النموذج قد يكون مخطئاً قرابة نصف الوقت.

الأمر لا يتعلق بنموذج واحد. Elon Musk يدّعي أن Grok هو الأذكى، لكن الأبحاث لا تدعم ذلك. في اختبار RealFactBench الذي طوره علماء كمبيوتر من الصين وبريطانيا، حل Claude في المقدمة بدقة 73% فقط. وفي اختبار SimpleQA من OpenAI، لم يتجاوز أي نموذج 50% من الدقة. حتى عند تحديث المعيار في 2025، جاء Gemini 2.5 Pro في الصدارة بنسبة 55.6%. وهذا يعني أن أفضل نموذج لا يزال يخطئ في أكثر من 44% من الحالات.

مقارنة النماذج: من الأقل خطأ؟

بينما تدّعي بعض النماذج دقة تصل إلى 90-96% في اختبارات احترافية مثل اختبارات شهادة طب النوم، فإن هذه الأرقام تخفي مشكلة أكبر. عندما سُئل ChatGPT عن دقة النماذج، أجاب بأنها تتراوح بين 90-96%، لكن الرابط الذي قدمه كان لورقة غير موجودة. هذا الهلوسة في الإحالات هو أحد أعراض المشكلة الجوهرية: الذكاء الاصطناعي يريد إرضاء المستخدم حتى لو كان ذلك على حساب الحقيقة.

دراسة حديثة من جمعية النهوض بالذكاء الاصطناعي (AAAI) تشير إلى أن النماذج الأذكى لا تعني بالضرورة هلوسة أقل؛ بل قد تعني العكس. النماذج المتطورة تبالغ في التعويض لتقديم إجابات تبدو مقنعة، مما يزيد من احتمالية نشر معلومات خاطئة.

لماذا يبقى الإنسان ضرورياً؟

في المملكة المتحدة، تعمل مبادرة Full Fact على تطوير أدوات ذكاء اصطناعي لمساعدة في تحديد الادعاءات الكاذبة، لكنها تؤكد أن الإنسان يبقى必不可缺. يقول مارك فرانكل، رئيس الشؤون العامة في Full Fact: “أنت بالتأكيد بحاجة إلى إنسان”. فعملية التحقق من الحقائق تتطلب تحليلاً سياقياً، وتدقيقاً في المصادر الأولية، ومقابلات مع الخبراء، وهذا ما لا تستطيع النماذج الحالية تقديمه.

في WIRED، يعمل فريق التدقيق بطريقة تقليدية: تعليقات حرفية سطراً سطراً، مصادر أولية كلما أمكن، ومراجعة أخلاقية وقانونية واسعة. هذا المستوى من الدقة لا يزال بعيداً عن متناول الذكاء الاصطناعي.

التطبيقات والروابط الرسمية

للاستزادة حول الموضوع، يمكنكم الاطلاع على المصادر التالية:

خلاصة: كيف تتعامل مع معلومات الذكاء الاصطناعي؟

الرسالة واضحة: لا تثق بشكل أعمى بأي إجابة يقدمها الذكاء الاصطناعي، خاصة في المواضيع الحساسة مثل الصحة والقانون والأخبار. استخدمه كأداة مساعدة، لكن تحقق دائماً من المصادر الأولية، واسأل الخبراء، وقارن بين نماذج مختلفة. الذكاء الاصطناعي قد يكون مفيداً في توليد الأفكار أو صياغة النصوص، لكنه ليس بديلاً عن العقل البشري الناقد. وكما يقول مدققو الحقائق: عملهم ليس فقط تصحيح الأخطاء، بل ضمان أن المعلومات التي تصل إليك موثوقة ودقيقة. في عالم يغرق بالمعلومات المضللة، قد يكون الشك الصحي هو أفضل صديق لك.

روابط مذكورة في المصدر

المصدر: Wired