أطلقت مايكروسوفت ثلاثة نماذج ذكاء اصطناعي جديدة ضمن منصة «فاوندري»، في خطوة تعكس تحولاً نحو بناء منظومة متكاملة تدعم التطبيقات متعددة الوسائط، بدلاً من الاعتماد على نماذج منفصلة لكل استخدام. تشمل النماذج: «MAI-Transcribe-1» لتحويل الصوت إلى نص،

و«MAI-Voice-1» لتوليد الصوت، و«MAI-Image-2» لإنشاء الصور، وهي متاحة حالياً للمطورين عبر «فاوندري» وبيئة «MAI Playground».من نماذج منفصلة إلى منظومة متكاملةيعكس هذا الإطلاق تحولاً في طريقة بناء تطبيقات الذكاء الاصطناعي، حيث تتجه مايكروسوفت نحو تطوير مجموعة من النماذج المتخصصة لكل نوع من بيانات الصوت والصورة والنص.

يتماشى هذا النهج مع الاتجاه الأوسع نحو «الذكاء الاصطناعي متعدد الوسائط»، الذي يسمح للأنظمة بالتعامل مع أنواع مختلفة من المدخلات والمخرجات ضمن تجربة واحدة.تحويل الصوت إلى نص بدقة عاليةيتميز نموذج «MAI-Transcribe-1» بقدرته على تحويل الكلام إلى نص بدقة عالية حتى في البيئات غير المثالية مثل الضوضاء أو تسجيلات الاجتماعات. يدعم النموذج 25 لغة من الأكثر استخداماً، ويحقق أداءً متقدماً مع سرعة معالجة أعلى مقارنة بالأنظمة السابقة،

مما يجعله مناسباً لمراكز الاتصال والاجتماعات حيث تتداخل الأصوات.توليد صوت طبيعي وسريعيركز نموذج «MAI-Voice-1» على توليد صوت واقعي من حيث النبرة والتعبير، مع القدرة على الحفاظ على هوية المتحدث حتى في المحتوى الطويل. يمكنه إنشاء أصوات مخصصة باستخدام عينة قصيرة من التسجيل الصوتي، وتوليد دقيقة من الصوت خلال ثانية واحدة تقريباً،

مما يفتح المجال لتطبيقات المساعدات الصوتية والمحتوى التفاعلي.إنشاء الصور بسرعة مضاعفةيوفر نموذج «MAI-Image-2» لإنشاء الصور سرعة توليد أعلى تصل إلى ضعفين مقارنة بالإصدارات السابقة، مع الحفاظ على جودة مناسبة للاستخدامات الإبداعية مثل التصميم والإعلانات. تم تحسين عناصر الإضاءة ودقة التفاصيل والنصوص داخل الصور لتلبية احتياجات المصممين وصناع المحتوى.السرعة والتكلفة عاملان حاسمانإلى جانب الأداء، تركز مايكروسوفت على تحقيق أفضل توازن بين السعر والأداء،

مع كفاءة أعلى في استخدام الموارد وتقليل استهلاك وحدات المعالجة الرسومية. يعكس هذا الواقع المتزايد الأهمية في سوق الذكاء الاصطناعي، حيث لم يعد التحدي في بناء النماذج فقط، بل في تشغيلها على نطاق واسع بتكلفة مقبولة.تعزيز الاستقلالية في الذكاء الاصطناعييعد هذا الإطلاق جزءاً من استراتيجية مايكروسوفت الأوسع لتعزيز استقلاليتها في مجال الذكاء الاصطناعي،

وتقليل الاعتماد على شركاء خارجيين في ظل المنافسة مع غوغل وأمازون. دمج هذه النماذج داخل منتجات مثل «كوبايلوت» و«تيمز» و«بينغ» يشير إلى توجه نحو جعل الذكاء الاصطناعي بنية أساسية داخل المنتجات الرقمية.من النماذج إلى التطبيقاتتوفر هذه الأدوات للمطورين إمكانية بناء تطبيقات تجمع بين الصوت والنص والصورة ضمن تجربة واحدة، مما يفتح المجال أمام أنظمة تحويل الاجتماعات إلى نصوص قابلة للبحث، ومساعدات صوتية أكثر واقعية،

وأدوات تصميم مدعومة بالذكاء الاصطناعي. يشير هذا الإطلاق إلى مرحلة جديدة تركز على منظومة متكاملة من النماذج المتخصصة بدلاً من نموذج واحد قوي. تركز النماذج على الأداء في البيئات الواقعية وسرعة المعالجة وليس فقط نتائج المختبر (مايكروسوفت) صور أنشأتها «WPP» باستخدام «MAI-Image-2» (مايكروسوفت) تسعى «مايكروسوفت» إلى تحقيق توازن بين الكفاءة والتكلفة في تشغيل نماذج الذكاء الاصطناعي (مايكروسوفت)