هل يمكن لأجهزة الكمبيوتر حقا تصحيح الامتحانات؟ فوائد التقييمات الآلية لتدريس اللغة الإنجليزية

Pearson Languages
الأيدي التي تكتب على جهاز كمبيوتر محمول مع الرموز

يعد التقييم الآلي ، بما في ذلك استخدام الذكاء الاصطناعي (الذكاء الاصطناعي) ، أحد أحدث حلول تكنولوجيا التعليم. إنه يسرع أوقات تصحيح الامتحان ، ويزيل التحيزات البشرية ، وهو دقيق وموثوق به على الأقل مثل الفاحصين البشريين. مع استمرار الابتكارات ، يعد هذا الابتكار مغيرا حقيقيا لقواعد اللعبة للمعلمين والطلاب.

ومع ذلك ، فقد قوبل بشكل مفهوم بالعديد من الأسئلة وأحيانا الشكوك في مجتمع ELT - هل يمكن لأجهزة الكمبيوتر حقا تصحيح اختبارات التحدث والكتابة بدقة؟

الجواب هو نعم مدوية. يخضع الطلاب من جميع أنحاء العالم بالفعل لاختبارات الذكاء الاصطناعي درجة. توفر اختبارات PTE Academic و Versant - على سبيل المثال - درجات آلية غير متحيزة وعادلة وسريعة لامتحانات التحدث والكتابة - بغض النظر عن المكان الذي يعيش فيه المتقدمون للاختبار ، أو لهجتهم أو جنسهم.

تشرح هذه المقالة العمليات الرئيسية التي ينطوي عليها الذكاء الاصطناعي التسجيل الآلي وتوضح أن التقنيات الذكاء الاصطناعي مبنية على أسس الأحكام البشرية المتسقة للخبراء. لذلك ، دعونا نوضح الالتباس حول التسجيل الآلي الذكاء الاصطناعي وننظر في كيفية مساعدة المعلمين والطلاب على حد سواء.

الذكاء الاصطناعي مقابل التسجيل الآلي التقليدي

بادئ ذي بدء ، دعنا نميز بين التسجيل الآلي التقليدي و الذكاء الاصطناعي. عندما نتحدث عن التسجيل الآلي ، فإننا نعني بشكل عام تسجيل العناصر التي تكون إما عناصر متعددة الخيارات أو عناصر مغلقة. قد تضطر إلى إعادة ترتيب الجمل ، والاختيار من قائمة منسدلة ، وإدراج كلمة مفقودة - هذا النوع من الأشياء. تم تصميم أنواع الأسئلة هذه لاختبار مهارات معينة ويضمن التسجيل الآلي إمكانية تمييزها بسرعة ودقة في كل مرة.

بينما يمكن استخدام عناصر يتم تسجيلها تلقائيا مثل هذه لتقييم المهارات الاستقبالية مثل الاستماع وفهم القراءة ، إلا أنها لا تستطيع تحديد المهارات الإنتاجية للكتابة والتحدث. ستكون استجابة كل طالب في الكتابة والتحدث مختلفة ، فكيف يمكن لأجهزة الكمبيوتر تمييزها؟

هذا هو المكان الذي يأتي فيه الذكاء الاصطناعي.

نسمع الكثير عن كيفية استخدام الذكاء الاصطناعي بشكل متزايد في المجالات التي تحتاج إلى التعامل مع كميات كبيرة من البيانات غير المهيكلة ، بشكل فعال ودقيق بنسبة 100٪ - كما هو الحال في التشخيص الطبي ، على سبيل المثال. في اختبار اللغة ، يستخدم الذكاء الاصطناعي برامج كمبيوتر متخصصة لتصنيف الاختبارات الكتابية والشفوية.

كيف يتم استخدام الذكاء الاصطناعي لتسجيل امتحانات المحادثة

الخطوة الأولى هي بناء نموذج صوتي لكل لغة يمكنه التعرف على الكلام وتحويله إلى أشكال موجية ونص. في حين أن هذه التكنولوجيا كانت غير عادية للغاية ، يمكن لمعظم هواتفنا الذكية القيام بذلك الآن.

ثم يتم تدريب هذه النماذج الصوتية لتسجيل كل موجه أو عنصر في الاختبار. نقوم بذلك باستخدام مقيمين خبراء بشريين لتسجيل العناصر أولا ، باستخدام العلامات المزدوجة. يسجلون مئات الردود الشفوية لكل عنصر ، ثم يتم استخدام هذه "المعايير" لتدريب المحرك.

بعد ذلك ، نقوم بالتحقق من صحة المحرك المدرب عن طريق تغذية العديد من العناصر التي تحمل علامة بشرية ، والتحقق من أن درجات الماكينة مرتبطة ارتباطا وثيقا بالدرجات البشرية. إذا لم يحدث هذا لأي عنصر ، فإننا نزيله ، حيث يجب أن يتطابق مع المعيار الذي حددته العلامات البشرية. نتوقع وجود علاقة بين .95-.99. وهذا يعني أنه سيتم وضع علامة على الاختبارات بين 95-99٪ تماما مثل العينات التي تحمل علامة بشرية.

هذا مرتفع بشكل لا يصدق مقارنة بموثوقية اختبارات التحدث التي تحمل علامة الإنسان. في جوهرها ، نستخدم مجموعة من المقيمين البشريين ذوي الخبرة العالية لتدريب محرك الذكاء الاصطناعي ، ثم يتم تكرار معيارهم مرة تلو الأخرى.

كيف يتم استخدام الذكاء الاصطناعي لتسجيل امتحانات الكتابة

يستخدم تسجيل الذكاء الاصطناعي في الكتابة لدينا تقنية تسمى التحليل الدلالي الكامن. LSA هي تقنية معالجة لغة طبيعية يمكنها تحليل الكتابة وتسجيلها ، بناء على المعنى الكامن وراء الكلمات - وليس فقط خصائصها السطحية.

على غرار نماذجنا الصوتية للتعرف على الكلام ، نقوم أولا بإنشاء نموذج التعرف على النص الخاص باللغة. نقوم بتغذية كمية كبيرة من النص في النظام ، ويستخدم LSA الذكاء الاصطناعي لمعرفة أنماط كيفية ارتباط الكلمات ببعضها البعض واستخدامها ، على سبيل المثال ، في اللغة الإنجليزية .

بمجرد إنشاء نموذج اللغة ، نقوم بتدريب المحرك على تسجيل كل عنصر مكتوب في الاختبار. كما هو الحال في العناصر الناطقة ، نقوم بذلك باستخدام مقيمين خبراء بشريين لتسجيل العناصر أولا ، باستخدام العلامات المزدوجة.

يسجلون عدة مئات من الردود المكتوبة لكل عنصر ، ثم يتم استخدام هذه "المعايير" لتدريب المحرك.

ثم نقوم بالتحقق من صحة المحرك المدرب عن طريق تغذية العديد من العناصر التي تحمل علامة بشرية ، والتحقق من أن درجات الماكينة مرتبطة ارتباطا وثيقا بالدرجات البشرية.

المعيار هو دائما درجات الخبراء البشرية. إذا كان نظام الذكاء الاصطناعي الخاص بنا لا يتطابق بشكل وثيق مع الدرجات التي تقدمها العلامات البشرية ، فإننا نزيل العنصر ، لأنه من الضروري مطابقة المعيار الذي حددته العلامات البشرية.

قدرة الذكاء الاصطناعي على تمييز سمات متعددة

أحد التحديات التي يواجهها الأشخاص في تسجيل العناصر الناطقة والمكتوبة هو تقييم العديد من السمات في عنصر واحد. على سبيل المثال ، عند تقييم وتسجيل التحدث ، قد يحتاجون إلى إعطاء درجات منفصلة للمحتوى والطلاقة والنطق.

في الردود المكتوبة ، قد تحتاج العلامات إلى تسجيل جزء من الكتابة للمفردات والأسلوب والقواعد. على نحو فعال ، قد يحتاجون إلى وضع علامة على كل عنصر على الأقل ثلاث مرات ، وربما أكثر. ومع ذلك ، بمجرد تدريب أنظمة الذكاء الاصطناعي على كل درجة سمة في التحدث والكتابة ، يمكنهم بعد ذلك تمييز العناصر على أي عدد من السمات على الفور - وبدون أخطاء.

افتقار الذكاء الاصطناعي إلى التحيز

الفرضية الأساسية لأي اختبار هي أنه لا ينبغي إعطاء أي ميزة أو عيب لأي مرشح. بمعنى آخر ، يجب ألا يكون هناك تحيز إيجابي أو سلبي. قد يكون من الصعب جدا تحقيق ذلك في تقييمات التحدث والكتابة التي تحمل علامة الإنسان. في الواقع ، غالبا ما يشعر المرشحون أنهم ربما حصلوا على درجة مختلفة إذا سمعهم شخص آخر أو قرأ عملهم.

أنظمتنا الذكاء الاصطناعي تقضي على قضية التحيز. يتم ذلك من خلال ضمان تدريب أنظمة الذكاء الاصطناعي التحدث والكتابة لدينا على مجموعة واسعة من اللهجات البشرية وأنواع الكتابة.

لا نريد لهجات مثالية تتحدث اللغة الأم أو أساليب كتابة لتدريب محركاتنا. نحن نستخدم عينات تمثيلية غير أصلية من جميع أنحاء العالم. عندما أنشأنا في البداية أنظمة الذكاء الاصطناعي الخاصة بنا لتسجيل درجات التحدث والكتابة ، جربنا عناصرنا ودربنا محركاتنا باستخدام ملايين ردود الطلاب. نواصل القيام بذلك الآن مع تطوير عناصر جديدة.

فوائد التقييم الآلي الذكاء الاصطناعي

لا حرج في وضع علامات يدوية على اختبارات وامتحانات الواجبات المنزلية. في الواقع ، من الضروري للمعلمين التعرف على طلابهم وتقديم ملاحظات ونصائح شخصية. ومع ذلك ، يمكن أن يكون تصحيح مئات الاختبارات يدويا ، يوميا أو أسبوعيا ، متكررا ويستغرق وقتا طويلا ولا يمكن الاعتماد عليه دائما ويستغرق وقتا بعيدا عن العمل جنبا إلى جنب مع الطلاب في الفصل الدراسي. يمكن أن يؤدي استخدام الذكاء الاصطناعي في التقييمات التكوينية والختامية إلى زيادة وقت الممارسة المقدر للطلاب وتقليل عبء التصحيح على المعلمين.

يستغرق تعلم اللغة وقتا طويلا ، الكثير من الوقت للتقدم إلى مستويات عالية من الكفاءة. يمكن أن يؤدي الاستخدام المخلوط الذكاء الاصطناعي إلى:

  • معالجة الأهمية المتزايدة للتقييم التكويني لدفع التعلم الشخصي وملاحظات التقييم التشخيصي

  • السماح للطلاب بالممارسة والحصول على ملاحظات فورية داخل وخارج وقت التدريس المخصص

  • معالجة مسألة عبء عمل المعلم

  • قم بإنشاء مزيج فاضل بين البشر والآلات ، والاستفادة مما يفعله البشر بشكل أفضل وما تفعله الآلات بشكل أفضل.

  • تقديم درجات تقييم تلخيصية عادلة وسريعة وغير متحيزة في الاختبارات عالية المخاطر.

نأمل أن تكون هذه المقالة قد أجابت على بعض الأسئلة الملحة حول كيفية استخدام الذكاء الاصطناعي لتقييم التحدث والكتابة في اختبارات اللغة لدينا. يصف اقتباس مثير للاهتمام من Fei-Fei Li ، كبير العلماء في Google وأستاذ ستانفورد الذكاء الاصطناعي مثل هذا:

"غالبا ما أخبر طلابي ألا يضللهم اسم" الذكاء الاصطناعي "- لا يوجد شيء مصطنع في ذلك. الذكاء الاصطناعي من صنع البشر ، ويهدف إلى التصرف [مثل] البشر ، وفي النهاية ، التأثير على حياة البشر والمجتمع البشري ".

الذكاء الاصطناعي في التقييمات التكوينية والختامية لن تحل أبدا محل دور المعلمين. ستدعم الذكاء الاصطناعي المعلمين ، وتوفر فرصا لا حصر لها للطلاب للتحسين ، وتوفر حلا للتقييمات البطيئة وغير الموثوقة وغير العادلة في كثير من الأحيان.

أمثلة على تقييمات الذكاء الاصطناعي في تدريس اللغة الإنجليزية

في بيرسون، قمنا بتطوير مجموعة من التقييمات باستخدام تقنية الذكاء الاصطناعي.

Versant

تعد اختبارات Versant أداة رائعة للمساعدة في وضع معايير الكفاءة اللغوية في أي مدرسة أو منظمة أو شركة. وهي مصممة خصيصا لاختبارات تحديد المستوى لتحديد المستوى المناسب للمتعلم.

PTE Academic

يستهدف Pearson Test of English Academic أولئك الذين يحتاجون إلى إثبات مستوى الإنجليزية للحصول على مكان جامعي أو وظيفة أو تأشيرة. يستخدم الذكاء الاصطناعي لتسجيل الاختبارات والنتائج متاحة في غضون خمسة أيام.

معيار الإنجليزية

يتم تسجيلالإنجليزية Benchmark أيضا باستخدام نفس تقنية التقييم الآلي. يستهدف هذا الاختبار ، الذي يتم إجراؤه على جهاز لوحي ، المتعلمين الصغار ويأخذ شكل اختبار ممتع يشبه اللعبة. يغطي مهارات التحدث والاستماع والقراءة والكتابة ، ويقيس قدرة الطالب ويقترح أنشطة المتابعة وخطوات التدريس التالية.

المزيد من المدونات من بيرسون

  • A woman stood in a square, holding a map looking around

    Essential English phrases to blend in like a local on your holiday

    By Charlotte Guest
    وقت القراءة: 5 minutes

    Summer has arrived and you might be gearing up for a holiday soon. Knowing some of the local language is always helpful, but to genuinely speak like a native English speaker, you must grasp and use common phrases and idioms that locals employ in daily conversations. Native English speakers have a natural command of these phrases, whereas non-fluent speakers often need to study and practice them to achieve fluency.

    In this blog post, we’ll delve into essential English phrases that will help you sound more like a local and less like a tourist.

  • A business woman sat at a table in a office writing notes

    Hard skills vs. soft skills: The impact of language learning

    By Charlotte Guest
    وقت القراءة: 6 minutes

    Hard skills and soft skills play a crucial role in defining career success and progression. The difference between hard skills and soft skills is that hard skills are teachable, technical, measurable abilities specific to particular jobs, while soft skills are more interpersonal, universal and related to personality traits. While hard skills refer to the technical knowledge and specific abilities required to perform a job, soft skills are more intangible. They encompass the interpersonal attributes and personality traits that enable individuals to communicate effectively, work collaboratively and adapt to changes in the workplace environment.

    In this blog post, we will explore how learning a new language can significantly enhance both hard and soft skills, making you a more versatile and effective professional in today’s multifaceted work environment.

    Understanding the balance of hard and soft skills

    Hard skills might get your foot in the door, showcasing your qualifications for a position. Developing hard skills to stand out from other job seekers is crucial; take advantage of classes, webinars and workshops offered by your current employer to develop hard skills and learn new technical skills. Examples include proficiency in a particular software, certification in a specific field, or mastery of a technical domain. However, it’s the soft skills, such as effective communication, collaboration, critical thinking and emotional intelligence, that propel you through the door and into the realms of career advancement. Recent research underscores the growing importance of English proficiency as a pivotal element in this dynamic, equally vital for enhancing both sets of skills.

    What are examples of soft skills?

    Soft skills encompass a wide range of attributes that can significantly impact workplace efficiency and harmony. Examples of essential soft skills include:

    Communication: The ability to convey information clearly and effectively is paramount. This includes both verbal and written communication, as well as active listening skills.

    Teamwork: Collaborating well with others, often with diverse backgrounds and perspectives, to achieve common goals.

    Problem-solving: The capability to analyze situations, identify problems and devise effective solutions.

    Adaptability: The readiness to adjust to new conditions, workflows, or technologies, demonstrating flexibility in the face of change.

    Critical thinking: The process of objectively analyzing information to make informed decisions.

    Emotional intelligence: The ability to understand, manage and utilize one's emotions constructively while also recognizing and influencing the emotions of others.

    What are examples of hard skills?

    Hard skills are quantifiable, teachable abilities specific to a job or industry. These skills are typically acquired through formal education, training programs and practical experience. Some examples of essential hard skills include:

    Computer programming: Proficiency in coding and programming languages, such as Python, Java, C++, or HTML/CSS is crucial for software development and web design roles.

    Data analysis: The ability to interpret complex data sets using tools like Excel, SQL, or R, providing valuable insights and informing decision-making processes.

    Graphic design: Mastery of design software such as Adobe Photoshop, Illustrator, and InDesign, enabling the creation of visual content for various media.

    Foreign language proficiency: Fluency in a second language can be an asset in international business, for example, in translation services or customer support roles.

    Project management: Knowledge of project management methodologies (e.g., Agile, Scrum) and tools (e.g., Microsoft Project, Jira) to plan, execute and oversee projects effectively.

    Technical writing: The skill of crafting clear, precise documentation and instructional materials, essential in industries such as engineering, IT and pharmaceuticals.

  • Business people sat and waiting in a row

    Boost the quality of your hires with English proficiency testing

    By Samantha Yates
    وقت القراءة: 6.5 minutes

    Hire quality is top of the agenda for recruiters and talent acquisition leaders. Discover the impact of English skill testing on hiring fit-for-role employees.

    The results are in… thousands of recruiting professionals and top talent acquisition leaders say that sourcing high-quality candidates is their number one objective in 2024 and beyond.

    54% of recruiters are now prioritizing quality of hire above all else, according to LinkedIn’s Talent Solutions report The Future of Recruiting 2024. The report also highlights that 73% are using a skills-based approach to find top-quality hires, faster, with skills that fit the business both now and in future.

    Getting recruitment right can drastically impact productivity. In the UK alone, effective recruitment boosts productivity by £7.7bn each year, according to the Recruitment and Employment Confederation (REC). Conversely, the direct and indirect costs of mistake hires are a constant concern to organizations, not just in the UK but around the world. According to a survey of 400 hiring decision-makers by CareerBuilder, 75% have hired the wrong person and say that one bad hire costs them nearly $17,000 on average. It’s no surprise then that skills-based quality hiring is such a top priority for recruiters.

    It’s harder than it might seem to systematically increase the quality of your hires, especially when you’re recruiting at scale. But the rewards are high when you get it right and a skills-first approach increases your chances of success – particularly when you focus on core skills like English proficiency that underpin communication. As an added bonus, skills-based testing can speed up the recruitment process significantly.