مهنة واحدة لا يمكن للذكاء الاصطناعي التفوق فيها على البشر

#سواليف

  • أظهر #الذكاء_الاصطناعي حتى الآن #براعة في سرد القصص وكتابة النصوص بشكل إبداعي، وتقديم إجابات أشبه بالبشر في كثير من الأحيان، حتى أنه تفوق على بعض #الأطباء في رعاية #المرضى والتعاطف معهم، ما أثار مخاوف بشأن قدرته غير المحدودة التي يمكن أن تكون سببا في استغناء بعض القطاعات عن البشر، إلا أن هناك مهنة واحدة فشل الذكاء الاصطناعي في أن يجد له موضع قدم فيها، ما يجعل البشر الممتهنين لها أقل توتراً.

ونقلت شبكة “فوكس بزنز” نتائج دراسة توصلت إلى أن الذكاء الاصطناعي ضعيف في #الرياضيات والعمليات الحسابية ما يبعد المنافسة عن العاملين في مهمة #المحاسبة.

يأتي ذلك فيما أثار نموذج الذكاء الاصطناعي “تشات جي بي تي” (ChatGPT) – وهو منصة الذكاء الاصطناعي الأسرع نمواً والأكثر شهرة حتى الآن – مخاوف بشأن قدرته على مساعدة الطلاب على الغش في الدورات الدراسية ومواد الاختبار. إذ اجتاز الروبوت 13 من 15 اختبارا من امتحانات المدارس العليا البريطانية أو ما يعرف بـ “AP”، وحصل على درجة شبه مثالية في اختبار تقييم الخريجين للدراسات العليا “GRE”.

ولكن الدراسة الجديدة التي أجراها أستاذ المحاسبة بجامعة بريغهام يونغ، الدكتور ديفيد وود، وجدت أنه غالباً ما تكافح منصات الذكاء الاصطناعي لفهم العمليات الرياضية، وغالباً ما تزين البيانات للتستر على الأخطاء عند حدوثها.

وسعت دراسة وود إلى اختبار كفاءة “ChatGPT” في إكمال اختبارات المحاسبة مقارنة بطلاب المحاسبة الفعليين. وتم تقديم 25181 سؤالاً حول نظم المعلومات، والتدقيق، والمحاسبة المالية، والمحاسبة الإدارية، والضرائب من 186 مؤسسة تعليمية في 14 دولة.

وتم تقديم الأسئلة في أشكال مختلفة مع مستويات متفاوتة من الصعوبة، مع استخدام مزيج من الاختيار من متعدد، والصواب / الخطأ، ومطالبات الاستجابة المكتوبة.

ووجدت الدراسة أن الطلاب سجلوا درجات أعلى من “ChatGPT”، متجاوزين روبوت المحادثة بأكثر من 30% – بمعدل 76.7% مقابل 47.4% في “ChatGPT”.

وتفوق “ChatGPT” على الطلاب فقط في 11.3% من الأسئلة، لا سيما تلك المتعلقة بالمراجعة ونظم المعلومات المحاسبية. إذ كان روبوت الدردشة أيضاً أكثر مهارة في الإجابة على أسئلة الاختيار من متعدد وأسئلة (صح / خطأ)، حيث سجل 59.5% و68.7% في كل تنسيق على حدة – ومع ذلك، كان أداؤه أقل بكثير في الأسئلة ذات الإجابات القصيرة، حيث حصل على ما بين 28.7% و39.1%.

اظهر المزيد

مقالات ذات صلة

زر الذهاب إلى الأعلى