×



klyoum.com
palestine
فلسطين  ١٠ تموز ٢٠٢٥ 

قم بالدخول أو انشئ حساب شخصي لمتابعة مصادرك المفضلة

ملاحظة: الدخول عن طريق الدعوة فقط.

تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

klyoum.com
palestine
فلسطين  ١٠ تموز ٢٠٢٥ 

قم بالدخول أو انشئ حساب شخصي لمتابعة مصادرك المفضلة

ملاحظة: الدخول عن طريق الدعوة فقط.

تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

موقع كل يوم »

اخبار فلسطين

»منوعات» شبكة مصدر الإخبارية»

"SpeechSSM".. نموذج صوتي جديد يولد كلاماً طبيعياً يصل لـ 16 دقيقة

شبكة مصدر الإخبارية
times

نشر بتاريخ:  الأربعاء ٩ تموز ٢٠٢٥ - ٠٣:٠٦

SpeechSSM.. نموذج صوتي جديد يولد كلاما طبيعيا يصل لـ 16 دقيقة

"SpeechSSM".. نموذج صوتي جديد يولد كلاماً طبيعياً يصل لـ 16 دقيقة

اخبار فلسطين

موقع كل يوم -

شبكة مصدر الإخبارية


نشر بتاريخ:  ٩ تموز ٢٠٢٥ 

وكالات – مصدر الإخبارية

طوّرت باحثة من كوريا الجنوبية نموذجاً لغوياً صوتياً جديداً يُعرف باسم 'SpeechSSM'، يمكّن من توليد كلام اصطناعي لكنه يبدو طبيعياً ومتواصلاً دون قيود زمنية، ما يُمهّد الطريق لتطوير نماذج صوتية تعمل على مدار الساعة.

ويُعدّ النموذج الجديد خطوة رائدة في تكنولوجيا الذكاء الاصطناعي التي تولد الأصوات، إذ يتغلب على القيود المعروفة للنماذج السابقة في إنتاج محتوى صوتي طويل كالذي تتطلبه برامج بودكاست، والكتب المسموعة، والتطبيقات التفاعلية.

جيل جديد من تقنيات معالجة اللغة

تبرز النماذج اللغوية الصوتية (SLMs) بوصفها الجيل القادم من تقنيات معالجة اللغة، كونها تتخطى قيود النماذج النصية التقليدية من خلال قدرتها على تعلم الكلام البشري مباشرة دون حاجة لتحويله إلى نص، وتستفيد هذه النماذج من الخصائص الصوتية الفريدة للبشر لإنتاج كلام عالي الجودة بسرعة، حتى في النماذج واسعة النطاق.

لكن النماذج السابقة كانت تواجه تحديات كبيرة في توليد محتوى طويل المدة، بسبب ارتفاع دقة تحليل المقاطع الصوتية واستهلاك الذاكرة أثناء محاولة التقاط التفاصيل الدقيقة عبر تقسيم الكلام إلى أجزاء صغيرة جداً، وكان من الصعب الحفاظ على الاتساق في المعنى ونبرة المتحدث عند التوليد لمدة طويلة.

توليد كلام لمدة طويلة وسرد سليم

النموذج الجديد 'SpeechSSM' يعتمد على هيكل 'هجيني' يجمع بين طبقات 'الانتباه' التي تركز على المعلومات الحديثة، وطبقات 'تكرارية' تتيح تذكّر السياق الكامل للنص أو المحادثة، وهذا التصميم يسمح بتوليد كلام يمتد لفترة طويلة مع الحفاظ على تماسك المعنى وسلاسة السرد، دون فقدان الخيط العام أو انحراف عن الموضوع.

وإلى جانب الحفاظ على التماسك السردي، فإن 'SpeechSSM' يقلل بشكل كبير من استهلاك الذاكرة والموارد الحاسوبية، إذ لا يتزايد الحمل الحسابي مع زيادة طول المدخلات، ما يجعل النموذج أكثر كفاءة واستقراراً.

ويعالج النموذج تسلسلات الكلام غير المحدودة عبر تقسيم البيانات إلى وحدات زمنية ثابتة وقصيرة (نوافذ)، وتحليل كل واحدة منها بشكل مستقل، ثم دمجها لإنتاج كلام طويل متماسك.

توليد كلام يصل إلى 16 دقيقة

في مرحلة توليد الصوت، يستخدم 'SpeechSSM' نموذجاً يُعرف باسم 'SoundStorm'، وهو نموذج تركيب صوتي غير تسلسلي (Non-Autoregressive) يتيح إنتاج مقاطع متعددة في آن واحد، على عكس النماذج التقليدية التي تبني الصوت كلمةً بكلمة أو حرفاً بحرف، وهذه التقنية تُسرّع عملية التوليد بشكل كبير دون التضحية بجودة الصوت.

وعلى عكس النماذج السابقة التي غالباً ما كانت تقتصر على توليد مقاطع قصيرة لا تتعدى 10 ثوانٍ، أنشأت الباحثة مجموعة بيانات جديدة تحت اسم 'LibriSpeech-Long'، تتيح اختبار قدرات النموذج في توليد كلام يصل إلى 16 دقيقة، ما يمثل إنجازاً مهماً في تقييم قدرات التوليد الصوتي طويل المدى.

ابتكار أدوات تقييم جديدة

إلى جانب تطوير النموذج، قدّمت الباحثة، أدوات تقييم جديدة تعالج قصور المقاييس التقليدية مثل Perplexity (الحيّرة) التي تقتصر على قياس الصحة اللغوية فقط. وتشمل الأدوات الجديدة مقياس 'SC-L' (الاتساق الدلالي مع مرور الوقت)، ومقياس 'N-MOS-T' (معدل تقييم الطبيعية الصوتية على مدى الزمن)، ما يتيح فهماً أعمق لتماسك وجودة المحتوى الصوتي الناتج.

وأظهرت التقييمات أن الكلام الذي يولده نموذج 'SpeechSSM' يحافظ على الشخصيات والأحداث المذكورة في بداية المحتوى، ويضيف شخصيات ومعلومات جديدة بطريقة طبيعية ومتسقة، حتى مع توليد كلام طويل المدة، وهو ما يمثل قفزة نوعية مقارنة بالنماذج السابقة التي كانت تميل إلى التكرار أو فقدان الموضوع مع مرور الوقت.

وقالت الباحثة: 'كانت النماذج اللغوية الصوتية التقليدية محدودة في قدراتها على توليد محتوى طويل المدى، وكان هدفنا تطوير نموذج يمكنه دعم الاستخدام البشري الحقيقي عبر توليد كلام طويل ومتسق'.

وأضافت: 'نعتقد أن هذا الإنجاز سيسهم في تطوير مجالات المحتوى الصوتي وتطبيقات الذكاء الاصطناعي مثل المساعدات الصوتية، من خلال تحسين الاتساق في المحتوى وقدرة النماذج على التفاعل بكفاءة وسرعة في الزمن الحقيقي'.

موقع كل يومموقع كل يوم

أخر اخبار فلسطين:

مراسلنا: مقتل 13 فلسطينيا وجرح العشرات بغارة إسرائيلية وسط قطاع غزة

* تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

* جميع المقالات تحمل إسم المصدر و العنوان الاكتروني للمقالة.

موقع كل يوم
20

أخبار كل يوم

lebanonKlyoum.com is 2078 days old | 311,341 Palestine News Articles | 3,817 Articles in Jul 2025 | 58 Articles Today | from 39 News Sources ~~ last update: 13 min ago
klyoum.com

×

موقع كل يوم


مقالات قمت بزيارتها مؤخرا



 SpeechSSM .. نموذج صوتي جديد يولد كلاما طبيعيا يصل لـ 16 دقيقة - ps
SpeechSSM .. نموذج صوتي جديد يولد كلاما طبيعيا يصل لـ 16 دقيقة

منذ ٠ ثانية


اخبار فلسطين

بالفيديو الإعلام الحربي اليمني ينشر مشاهد استهداف وغرق السفينة ماجيك سيز في البحر الأحمر - ps
بالفيديو الإعلام الحربي اليمني ينشر مشاهد استهداف وغرق السفينة ماجيك سيز في البحر الأحمر

منذ ٠ ثانية


اخبار فلسطين

تناول الفستق ليلا يفيد حالة ما قبل السكري - jo
تناول الفستق ليلا يفيد حالة ما قبل السكري

منذ ٠ ثانية


اخبار الاردن

عمان عاصمة للشباب العربي 2025 .. إنجاز وطني يعزز مكانة الأردن - jo
عمان عاصمة للشباب العربي 2025 .. إنجاز وطني يعزز مكانة الأردن

منذ ثانية


اخبار الاردن

ضبط سائق نقل بتهمة دهس مواطن في السلام.. و التحقيقات : لا يحمل رخصة قيادة - eg
ضبط سائق نقل بتهمة دهس مواطن في السلام.. و التحقيقات : لا يحمل رخصة قيادة

منذ ثانية


اخبار مصر

أخبار التوك شو بكرى: الجيش المصرى قادر على تأديب أى قوة معادية .. حقيقة نفوق 30 من الدواجن بسبب فيروس وبائي - eg
أخبار التوك شو بكرى: الجيش المصرى قادر على تأديب أى قوة معادية .. حقيقة نفوق 30 من الدواجن بسبب فيروس وبائي

منذ ثانية


اخبار مصر

 عزم النيابية تدين الاعتداء على الصحفي فارس الحباشنة وتطالب بمحاسبة الفاعلين - jo
عزم النيابية تدين الاعتداء على الصحفي فارس الحباشنة وتطالب بمحاسبة الفاعلين

منذ ثانية


اخبار الاردن

مختل عقليا يتسبب في فاجعة أثناء نقله بالإسعاف ضواحي مراكش - ma
مختل عقليا يتسبب في فاجعة أثناء نقله بالإسعاف ضواحي مراكش

منذ ثانية


اخبار المغرب

تدريبات فنية ومحاضرة من فيريرا للاعبي الزمالك - eg
تدريبات فنية ومحاضرة من فيريرا للاعبي الزمالك

منذ ثانية


اخبار مصر

عيار 21 الآن.. سعر الذهب اليوم الأحد 18-5-2025 بعد آخر انخفاض بالصاغة - eg
عيار 21 الآن.. سعر الذهب اليوم الأحد 18-5-2025 بعد آخر انخفاض بالصاغة

منذ ثانيتين


اخبار مصر

تكلفتها مليون جنيه يدفع المريض 400 جنيه فقط.. تفاصيل عملية تمدد الشريان الأورطي - eg
تكلفتها مليون جنيه يدفع المريض 400 جنيه فقط.. تفاصيل عملية تمدد الشريان الأورطي

منذ ثانيتين


اخبار مصر

القيروان: احتجاج على الغاء قسم الفنون بالمعاهد الثانوية بالجهة - tn
القيروان: احتجاج على الغاء قسم الفنون بالمعاهد الثانوية بالجهة

منذ ثانيتين


اخبار تونس

غريب:المعركة مفتوحة ضد المشروع الصهيوني الاميركي لأنه سبب مشاكل المنطقة - lb
غريب:المعركة مفتوحة ضد المشروع الصهيوني الاميركي لأنه سبب مشاكل المنطقة

منذ ثانيتين


اخبار لبنان

الحوثيون يعلنون قصف قاعدة جوية إسرائيلية بصاروخ فرط صوتي - ye
الحوثيون يعلنون قصف قاعدة جوية إسرائيلية بصاروخ فرط صوتي

منذ ثانيتين


اخبار اليمن

تفاصيل البيان الختامي للقمة العربية مع مراسل الجديد من بغداد - lb
تفاصيل البيان الختامي للقمة العربية مع مراسل الجديد من بغداد

منذ ٣ ثواني


اخبار لبنان

5 أسباب خفية للإمساك رغم تناول أطعمة غنية بالألياف - xx
5 أسباب خفية للإمساك رغم تناول أطعمة غنية بالألياف

منذ ٣ ثواني


لايف ستايل

40 قتيلا على الأقل بوسط نيجيريا في مواجهات مع عصابة مسلحة - ye
40 قتيلا على الأقل بوسط نيجيريا في مواجهات مع عصابة مسلحة

منذ ٣ ثواني


اخبار اليمن

حكومة الدبيبة تعين جمال شعبان وكيلا بوزارة الاقتصاد لشؤون الاستثمار - ly
حكومة الدبيبة تعين جمال شعبان وكيلا بوزارة الاقتصاد لشؤون الاستثمار

منذ ٣ ثواني


اخبار ليبيا

 إغاثي الملك سلمان يوزع 2.153 سلة غذائية في ريف دمشق - sa
إغاثي الملك سلمان يوزع 2.153 سلة غذائية في ريف دمشق

منذ ٣ ثواني


اخبار السعودية

انطلاق فعاليات اللقاء العشرين لشباب العواصم العربية في عمان - jo
انطلاق فعاليات اللقاء العشرين لشباب العواصم العربية في عمان

منذ ٤ ثواني


اخبار الاردن

* تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

* جميع المقالات تحمل إسم المصدر و العنوان الاكتروني للمقالة.






لايف ستايل