لديه واحدة من أكثر الأصوات التي يمكن التعرف عليها على الفور في بريطانيا ، لكن هل تساءلت يومًا كيف سيكون صوت ديفيد أتينبورو يتحدث الألمانية؟
حسنًا ، يمكنك الآن معرفة ذلك ، بفضل أداة الذكاء الاصطناعي الجديدة التي يمكنها استنساخ صوت أي شخص وجعله يقول أي شيء بلغات متعددة.
تتطلب الأداة ، بواسطة ElevenLabs ، بضع ثوانٍ فقط من الصوت ، كما أنها تحافظ على نغمة الصوت الأصلية للمتحدث.
يأمل منشئو المحتوى أن يؤدي ذلك إلى “توسيع الآفاق” في العديد من المجالات بما في ذلك النشر وتطوير الألعاب ووسائل الإعلام.
يمكنك تجربتها بنفسك على موقع ElevenLabs باستخدام صوتك أو صوت المشاهير المفضلين لديك!
يترجم برنامج ElevenLabs الأصوات مع الحفاظ على نبرة صوت المتحدث
غردت ElevenLabs: “نقدم لكم Eleven Multilingual v1: نموذجنا الجديد لتركيب الكلام! يسعدنا إطلاق نموذجنا الجديد الذي يدعم سبع لغات جديدة: الفرنسية والألمانية والهندية والإيطالية والبولندية والبرتغالية والإسبانية.
“هذا التقدم يوسع آفاق المبدعين ومطوري الألعاب والناشرين ، ويمهد الطريق لاستخدام الوسائط التوليدية لإنشاء محتوى أكثر محلية ، ويمكن الوصول إليه ، وخيالي.”
غمر موقع Twitter بالتعليقات بعد الإعلان ، حيث قام المستخدمون باختبار البرنامج على وجوه مشهورة مختلفة.
كان دونالد ترامب من بين أولئك الذين تم العبث بهم بينما ترجمت ElunaAI ما يبدو أنه استنساخ لصوته قائلاً إنه “ لم يتسبب أبدًا في أي جدل ”.
وفي الوقت نفسه ، قام مستخدم آخر بتحويل صوت ديفيد أتينبورو إلى اللغة الألمانية حيث تحدث مذيع البي بي سي عن إمكانات الذكاء الاصطناعي.
قال مستخدم تويتر: “باستخدام هذه الأداة ، يمكن لأي شخص القيام بذلك”. “من المهم أيضًا ملاحظة أن المحتالين سيقومون بالتأكيد بإساءة استخدام هذا”.
تدعي شركة ElevenLabs أن نموذجها قد تم تصميمه لفهم العاطفة والمنطق وراء الكلمات لإنشاء صوت طبيعي ومقنع.
في حين أنه يمكنه استنساخ الأصوات من العينات المقدمة ، فإن النموذج لديه أيضًا القدرة على إنشاء أصوات جديدة تمامًا من الصفر لم يتم التحدث بها من قبل.
قالت شركة ElevenLabs إن بعض الأرقام والرموز قد يتم نطقها بشكل غير صحيح حاليًا ، لكنها تعمل على تحسينها.
تعتقد الشركة التي تتخذ من الولايات المتحدة مقراً لها أن أداتها ستثبت أنها مفيدة في عدد من الصناعات المختلفة من التعليم إلى وسائل الإعلام.
وقالت: “ يمكن لمطوري اللعبة وناشريها إنشاء تجارب محلية غامرة للجمهور الدولي ، وتجاوز حواجز اللغة والتواصل مع اللاعبين والمستمعين لزيادة المشاركة والكفاءة إلى أقصى حد ، دون خسارة الجودة أو الدقة.
تمتلك المؤسسات التعليمية الآن الوسائل لإنتاج محتوى صوتي لمختلف المستخدمين بلغاتهم المستهدفة ، وتعزيز فهم اللغة وحتى مهارات النطق ، بالإضافة إلى تلبية أنماط التدريس المختلفة واحتياجات التعلم.
كان منشئو الكتب المسموعة والمحتوى أيضًا من بين أولئك الذين قد يجدونها مفيدة ، وذلك بفضل قدرة النموذج على إنشاء أصوات فريدة تشبه الشخصيات.
وأضاف ElevenLabs: “يمكن الآن لمعاهد إمكانية الوصول تمكين الأشخاص الذين يعانون من إعاقات بصرية أو صعوبات في التعلم من خلال تزويدهم بوسائل لتحويل الموارد التي يصعب الوصول إليها بسهولة إلى وسيط يناسب احتياجاتهم ، سواء في المحتوى أو الشكل.”
يأمل المبدعون أن هذه التكنولوجيا الجديدة “توسع الآفاق” في العديد من الصناعات العالمية
يمكن للنموذج الجديد استنساخ الأصوات بالإضافة إلى إنشاء أصوات جديدة تمامًا لم يتم التحدث بها من قبل
في وقت لاحق من هذا العام ، تأمل شركة ElevenLabs في منح المستخدمين تحكمًا كاملاً في الصوت الذي تم إنشاؤه ، مما يسمح بضبط السرعة وإدخال فترات التوقف المؤقت.
أضاف ElevenLabs: “إن جلستنا موجودة للمساعدة في جعل رؤيتك حقيقة واقعة”.
على الرغم من مزاياها ، يأتي إطلاق ElevenLabs وسط مخاوف عديدة تحيط بموجة تقنية استنساخ الصوت الجديدة.
في الشهر الماضي ، انتشر مستخدم مجهول لـ TikTok ، @ ghostwriter977 ، بعد تحميل أغنية Drake التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي تعرض The Weeknd.
لقد أثار تساؤلات حول المنطقة الرمادية للموسيقى المصنوعة بالذكاء الاصطناعي وما إذا كانت تعد انتهاكًا لحقوق الطبع والنشر.
ومع ذلك ، تدعي شركة ElevenLabs أنها “ملتزمة تمامًا” باحترام حقوق المبدعين في خضم تطوراتها التكنولوجية.
قال: “في Eleven ، نعتقد أنه يجب أن نسعى جاهدين لتحقيق أقصى استفادة من التقنيات الجديدة ، ولكن ليس بأي ثمن.
بينما نقوم بتطويرها ، فإننا نبذل قصارى جهدنا لتنفيذ الضمانات المناسبة التي تقلل من مخاطر الإساءة الضارة. مع وضع ذلك في الاعتبار ، نحن ملتزمون تمامًا باحترام حقوق الملكية الفكرية وبإساءة الاستخدام.
تواصل MailOnline مع ElevenLabs للتعليق.
اترك ردك