تعمل Meta على بناء ذكاء اصطناعي يتعرف على أكثر من 4000 لغة

أعلنت شركة Meta عن نماذج ذكاء اصطناعي جديدة قادرة على التعرف على الكلام واستنساخه 1100 لغة. هذا هو عشرة أضعاف قدرة التقنيات المماثلة المتاحةوعدت الشركة اتصلت. وأكد أن هذه مبادرة تهدف إلى حماية اللغات المهددة بالانقراض.

هذا هو خطاب متعدد اللغات رائع (رسائل الوسائط المتعددة) تم إتاحته للجمهور من خلال خدمة استضافة الكود GitHub. وأوضح ميتا أن إطلاقها كمصدر مفتوح سيساعد المطورين على إنشاء تطبيقات صوتية جديدة وأكثر شمولاً.

يمكن للموديلات الجديدة قراءة النص وتحويله إلى كلام (والتعرف على الكلام وتحويله إلى نص) بأكثر من 1100 لهجة. لكن، يمكنهم التعرف على أكثر من 4000 شخصيمثل هذا سعة 40 مرة أكثر مما كان متاحًا في السابق.

يوجد حوالي 7000 لغة في العالم ، لكن أدوات التعرف على الكلام التقليدية الحالية لا تتعرف إلا على حوالي 100 لغة. تتطلب معظم هذه الأنظمة عادةً كميات كبيرة من بيانات التدريب المسمى ، مثل النصوص. المشكلة هي أن هذه متوفرة فقط في عدد قليل من اللغات ، بما في ذلك الإسبانية والإنجليزية والصينية.

كيف أنشأت Meta الذكاء الاصطناعي لألف لغة؟

إنها تستفيد من نموذج ذكاء اصطناعي تم تطويره في Meta 2020. يمكن للنظام بالفعل التعرف على أنماط الكلام من الصوت ، ولا يتطلب كميات كبيرة من البيانات المصنفة مثل النصوص.

استخدمت الشركة الأم لـ Facebook و Instagram مجموعتين جديدتين من البيانات. هناك أول التسجيلات الصوتية ونصوص العهد الجديد للكتاب المقدس، تم استرجاعه من الإنترنت بـ 1107 لغة. تم نشر التسجيلات الصوتية غير المسماة للعهد الجديد الثاني في 3809 لهجة. استعراض تكنولوجيا معهد ماساتشوستس للتكنولوجيا.

استخدم الباحثون الفوقي خوارزمية مصممة لمواءمة التسجيلات الصوتية مع النص المصاحب. كرروا نفس العملية بخوارزمية ثانية مدربة على البيانات المتوافقة حديثًا. وهكذا ، أخيرًا ، قام الفريق بتدريب خوارزمية لتعلم لغة جديدة بسهولة ، حتى دون الحاجة إلى نص مصاحب.

READ  تنزيل WhatsApp Plus 2024 APK: تثبيت أحدث إصدار وتحديث الإصدار 17.60 مجانًا على iPhone وAndroid - الاتجاهات | لعبة اللعب
لغات الرسم البياني ميتا

قارن ميتا نماذجهم OpenAI Whisper والمنافسين الآخرين. ويؤكد ، لديها نصف معدل الخطأ ، على الرغم من أنها تغطي 11 ضعف عدد اللغات.

قال مايكل آلي ، العالم الذي عمل في المشروع ، لمعهد ماساتشوستس للتكنولوجيا: “يمكن الآن بناء أنظمة الصوت بسرعة باستخدام القليل جدًا من البيانات”. ومع ذلك ، حذر الباحثون من أن هذه النماذج اللغوية المدعومة بالذكاء الاصطناعي قد تستمر في نسخ بعض الكلمات أو العبارات بشكل غير صحيح. في الممارسة العملية ، يمكن أن يؤدي هذا إلى علامات غير صالحة أو ضارة.

أخبار فنية وعلمية في دقيقتين

احصل على نشرتنا الإخبارية على بريدك الإلكتروني كل صباح. دليل مدته دقيقتان لفهم ما يهم حقًا في التكنولوجيا والعلوم والثقافة الرقمية.

يعالج…

مستعد! أنك بالفعل مشترك

حدث خطأ ، يرجى تحديث الصفحة والمحاولة مرة أخرى

أيضًا في النص التشعبي:

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *