أصواتنا فريدة من نوعها تمامًا مثل بصمات الأصابع، فكيف ستشعر إذا تم استنساخ صوتك؟
ظهر في الأشهر الأخيرة نوع جديد من التزييف العميق يُعرف باسم استنساخ الصوت، حيث يستخدم المتسللون الذكاء الاصطناعي (AI) لمحاكاة صوتك.
الوجوه الشهيرة بما في ذلك ستيفن فراي وصادق خان وجو بايدن جميعهم كانوا بالفعل ضحايا لاستنساخ الصوت، في حين تم خداع أحد المديرين التنفيذيين الذي لم يذكر اسمه لتحويل 243 ألف دولار إلى محتال بعد تلقي مكالمة هاتفية مزيفة.
ولكن كيف يعمل، وما مدى إقناعه؟
لمعرفة ذلك، سمحت لمتسلل محترف باستنساخ صوتي – وكانت النتائج مرعبة.
ظهر في الأشهر الأخيرة نوع جديد من التزييف العميق يُعرف باسم استنساخ الصوت، حيث يستخدم المتسللون الذكاء الاصطناعي (AI) لمحاكاة صوتك. ولكن كيف يعمل، وما مدى إقناعه؟ لمعرفة ذلك، سمحت لمتسلل محترف باستنساخ صوتي – وكانت النتائج مرعبة
استنساخ الصوت هو تقنية ذكاء اصطناعي تسمح للمتسللين بأخذ تسجيل صوتي لشخص ما، وتدريب أداة الذكاء الاصطناعي على صوته، وإعادة إنشائه.
وفي حديثه إلى MailOnline، أوضح Dane Sherrets، مهندس الحلول في HackerOne: “تم استخدام هذا في الأصل لإنشاء كتب صوتية ولمساعدة الأشخاص الذين فقدوا أصواتهم لأسباب طبية”.
“ولكن اليوم، يتم استخدامه بشكل متزايد من قبل هوليوود، وللأسف المحتالين.”
عندما ظهرت التكنولوجيا لأول مرة في أواخر التسعينيات، كان استخدامها يقتصر على الخبراء ذوي المعرفة المتعمقة بالذكاء الاصطناعي.
ومع ذلك، على مر السنين، أصبحت التكنولوجيا أكثر سهولة وبأسعار معقولة، لدرجة أنه يمكن لأي شخص تقريبًا استخدامها، وفقًا للسيد شيريتس.
وقال: “يمكن لأي شخص لديه خبرة محدودة للغاية استنساخ الصوت”.
“ربما يستغرق الأمر أقل من خمس دقائق باستخدام بعض الأدوات المتوفرة المجانية والمفتوحة المصدر.”
عندما ظهرت التكنولوجيا لأول مرة في أواخر التسعينيات، كان استخدامها يقتصر على الخبراء ذوي المعرفة المتعمقة بالذكاء الاصطناعي. ومع ذلك، على مر السنين، أصبحت التكنولوجيا أكثر سهولة وبأسعار معقولة، لدرجة أنه يمكن لأي شخص تقريبًا استخدامها، وفقًا للسيد شيريتس (صورة مخزنة)
لاستنساخ صوتي، كل ما احتاجه السيد شيريتس هو مقطع فيديو مدته خمس دقائق وأنا أتحدث.
اخترت أن أسجل نفسي وأنا أقرأ قصة في صحيفة ديلي ميل، على الرغم من أن شيريتس يقول إن معظم المتسللين يمكنهم ببساطة سرقة الصوت من مكالمة هاتفية سريعة، أو حتى من مقطع فيديو منشور على وسائل التواصل الاجتماعي.
ومن الممكن القيام بذلك أثناء المكالمة، إذا كان هناك شيء تمت مشاركته على وسائل التواصل الاجتماعي، أو حتى إذا كان شخص ما يشارك في البث الصوتي. وقال: “إنها في الحقيقة مجرد أشياء نقوم بتحميلها أو تسجيلها كل يوم”.
بمجرد أن أرسلت المقطع للسيد شيريتس، قام ببساطة بتحميله إلى أداة (اختار عدم ذكر اسمها)، والتي يمكن بعد ذلك “تدريبها” على صوتي.
وقال: “بمجرد الانتهاء من ذلك، تمكنت من الكتابة أو حتى التحدث مباشرة في الأداة، وجعلها تخرج ما أريد أن تكون الرسالة بصوتك”.
“الشيء المجنون حقًا في الأدوات المتوفرة الآن هو أنني قادر على إضافة المزيد من التصريفات أو التوقفات أو أشياء أخرى تجعل الكلام يبدو أكثر طبيعية، مما يجعله أكثر إقناعًا في سيناريو الاحتيال.”
على الرغم من عدم احتوائه على أي توقفات أو تصريفات إضافية، فإن المقطع الأول من استنساخ صوتي الذي أنشأه السيد شيريتس كان مقنعًا بشكل مذهل.
لقد أتقن صوت الروبوت لهجتي الأمريكية الاسكتلندية الهجينة تمامًا، حيث قال: “مرحبًا أمي، أنا شيفالي”. لقد فقدت بطاقتي المصرفية وأحتاج إلى تحويل بعض الأموال. هل يمكنك من فضلك إرسال بعض منها إلى الحساب الذي أرسل لك رسالة نصية للتو؟
ومع ذلك، فقد تم رفع مستوى الرعب قليلاً في المقطع التالي، حيث أضاف السيد شيريتس توقفات مؤقتة.
وأوضح المتسلل المحترف: “في النهاية، يمكنك سماع توقف طويل، ثم نفسًا، وهذا يجعل الأمر يبدو طبيعيًا أكثر بكثير”.
في حين أن تجربتي في استنساخ الصوت كانت مجرد عرض توضيحي لحسن الحظ، إلا أن السيد شيريتس يسلط الضوء على بعض المخاطر الجسيمة لهذه التكنولوجيا.
وقال: “لقد تلقى بعض الأشخاص مكالمات وهمية بشأن الاختطاف، حيث اتصل بهم “طفلهم” قائلاً: “لقد تم اختطافي، أحتاج إلى ملايين الدولارات وإلا فلن يطلقوا سراحي”، ويبدو الطفل حزينًا للغاية”. .
“ما نشهده اليوم، على نحو متزايد، هو أن الناس يحاولون القيام بمحاولات هندسة اجتماعية أكثر استهدافًا ضد الشركات والمنظمات.
لقد استخدمت نفس التقنية لاستنساخ صوت مديري التنفيذي.
“غالبًا ما يظهر الرؤساء التنفيذيون علنًا، لذلك من السهل جدًا الحصول على صوت عالي الجودة لأصواتهم واستنساخه.
لقد أتقن صوت الروبوت لهجتي الأمريكية الاسكتلندية الهجينة تمامًا، حيث قال: “مرحبًا أمي، أنا شيفالي”. لقد فقدت بطاقتي المصرفية وأحتاج إلى تحويل بعض الأموال. هل يمكنك من فضلك إرسال بعض منها إلى الحساب الذي أرسل لك رسالة نصية للتو؟
استنساخ الصوت هو تقنية ذكاء اصطناعي تسمح للمتسللين بأخذ تسجيل صوتي لشخص ما، وتدريب أداة الذكاء الاصطناعي على صوته، وإعادة إنشائه
“إن الحصول على صوت الرئيس التنفيذي يجعل من السهل جدًا الحصول على كلمة مرور سريعة أو الوصول إلى النظام. يتعين على الشركات والمنظمات أن تكون على دراية بهذا الخطر.
ولحسن الحظ، يقول شيريتس إن هناك العديد من العلامات الرئيسية التي تشير إلى أن الصوت مستنسخ.
وقال لـ MailOnline: “هناك علامات رئيسية”.
“هناك فترات توقف مؤقتة، والقضايا التي لا يبدو فيها الأمر طبيعيًا، وقد يكون هناك ما تسميه “المصنوعات اليدوية” في الخلفية.
“على سبيل المثال، إذا تم استنساخ صوت في غرفة مزدحمة وكان هناك الكثير من الأشخاص الآخرين يتحدثون، فعند استخدام هذا النسخ الصوتي، ستسمع بعض الأشياء غير المرغوب فيها في الخلفية.”
ومع ذلك، مع استمرار تطور التكنولوجيا، سيصبح اكتشاف هذه العلامات أكثر صعوبة.
وأوضح: “يجب أن يكون الناس على دراية بهذه التكنولوجيا، وأن يكونوا متشككين دائمًا في أي شيء يطلب منهم التصرف بشكل عاجل – وهذا غالبًا ما يكون علامة حمراء”.
“يجب أن يكونوا سريعين في طرح الأسئلة التي ربما لا يعرفها إلا الشخص الحقيقي، وألا يخافوا من محاولة التحقق من الأشياء قبل اتخاذ أي إجراء.”
يوصي السيد شيريتس بالحصول على “كلمة آمنة” مع عائلتك وأصدقائك.
وقال: “إذا كنت حقًا في موقف عاجل، فيمكنك أن تقول تلك الكلمة الآمنة وسيعرفون على الفور أن هذا هو أنت حقًا”.
وأخيرًا، ينصح الخبير بأن تكون على دراية ببصمتك الرقمية، وأن تراقب الكمية التي تقوم بتحميلها عبر الإنترنت.
وأضاف: “في كل مرة أقوم بالتحميل الآن، فإنه يوسع سطح الهجوم الصوتي الخاص بي ويمكن استخدامه لتدريب الذكاء الاصطناعي لاحقًا”.
“هناك مقايضات يجب على الجميع القيام بها، ولكن هذا شيء يجب أن تكون على دراية به – يمكن استخدام الصوت الخاص بك الذي يطفو على السطح ضدك.”
اترك ردك