مساعد افتراضي

المساعد الافتراضي الذكي (IVA) أو المساعد الشخصي الذكي (IPA) هو وكيل برمجيات يمكنه أداء المهام أو الخدمات للفرد بناءً على أوامر أو أسئلة. أحيانًا يتم استخدام مصطلح "روبوت الدردشة" للإشارة إلى المساعدين الافتراضيين بشكل عام أو للوصول إليهم بشكل خاص من خلال الدردشة عبر الإنترنت. في بعض الحالات، تكون برامج الدردشة عبر الإنترنت مخصصة للأغراض الترفيهية حصريًا. يستطيع بعض المساعدين الافتراضيين تفسير الكلام البشري والاستجابة من خلال الأصوات المركبة. يمكن للمستخدمين طرح أسئلة على مساعديهم، والتحكم في أجهزة التشغيل الآلي للمنزل وتشغيل الوسائط عبر الصوت، وإدارة المهام الأساسية الأخرى مثل البريد الإلكتروني، وقوائم المهام والتقويمات باستخدام الأوامر الشفهية (المنطوقة). [1] أنظمة الحوار هو مفهوم مماثل، ولكن مع وجود اختلافات. [2]

مساعد جوجل يعمل على هاتف Pixel XL الذكي
جهاز التحكم عن بعد في Apple TV ، حيث يمكن للمستخدمين أن يطلبوا من سيري المساعد الافتراضي العثور على المحتوى لمشاهدته
مكبرات الصوت الذكية Amazon Echo تقوم بتشغيل المساعد الافتراضي أليكسا

اعتبارًا من عام 2017، توسعت إمكانيات واستخدامات المساعدين الافتراضيين بسرعة، مع دخول منتجات جديدة إلى السوق وتركيز قوي على كل من واجهات مستخدم البريد الإلكتروني والصوت. لدى أبل وجوجل قواعد كبيرة مثبتة من المستخدمين على الهواتف الذكية. تمتلك مايكروسوفت قاعدة كبيرة مثبتة من أجهزة الكمبيوتر الشخصية والهواتف الذكية والسماعات الذكية المستندة إلى ويندوز. تمتلك أمازون قاعدة مثبتة كبيرة لمكبرات الصوت الذكية.[3] لدى كونفرسيكا أكثر من 100 مليون مشاركة عبر المساعدون الافتراضيون الذكيون للبريد الإلكتروني وواجهة الرسائل القصيرة للأعمال.

التاريخ

العقود التجريبية: 1910 - 1980

كان راديو ريكس أول لعبة يتم تفعيلها بالصوت في عام 1911.[4] كان كلبًا يخرج من منزله عند مناداة اسمه.

في عام 1952، قدمت مختبرات Bell آلة التعرف التلقائي على الأرقام Audrey. احتلت الآلة رف ترحيل بارتفاع ستة أقدام، واستهلكت طاقة كبيرة، وكان بها العديد من الكابلات وتعرضت لمشاكل صيانة عديدة مرتبطة بدوائر الأنابيب المفرغة المعقدة. يمكن للألة التعرف على الوحدات الأساسية للكلام، الصوتيات. كانت الآلة تقتصر على التعرف الدقيق على الأرقام التي يتحدث بها متحدثون معينون. لذلك، كان يمكن استخدامها للاتصال الصوتي، ولكن في معظم الحالات، كان الاتصال بالضغط على الزر أرخص وأسرع، بدلاً من التحدث بالأرقام المتتالية.[5]

من الأدوات المبكرة الأخرى التي تم تمكينها لإجراء التعرف الرقمي على الكلام كانت الآلة الحاسبة التي يتم تنشيطها صوتيًا من IBM Shoebox، والتي تم تقديمها لعامة الناس خلال معرض سياتل العالمي عام 1962 بعد إطلاقتها الأولى في السوق عام 1961. هذا الكمبيوتر المبكر، الذي تم تطويره قبل 20 عامًا تقريبًا من إدخال أول كمبيوتر شخصي من آي بي إم في عام 1981، كان قادرًا على التعرف على 16 كلمة منطوقة وعلى الأرقام من 0 إلى 9.

تم تطوير أول برنامج كمبيوتر لمعالجة اللغة الطبيعية أو روبوت الدردشة إليزا بواسطة الأستاذ جوزيف وايزنباوم في معهد ماساتشوستس للتكنولوجيا في الستينيات. تم إنشاؤه لـ"إثبات أن الاتصال بين الإنسان والآلة كان سطحيًا".[6] استخدمت إليزا منهجية مطابقة الأنماط والاستبدال في الاستجابات النصية لمحاكاة المحادثة، مما أعطى وهمًا بالفهم من جانب البرنامج.

وبحسب ما ورد طلبت سكرتيرة وايزنباوم الخاصة من وايزنباوم مغادرة الغرفة حتى تتمكن هي وإليزا من إجراء محادثة حقيقية. تفاجأ وايزنباوم بهذا، وكتب لاحقًا: "لم أدرك ... أن التعرض القصير للغاية لبرنامج كمبيوتر بسيط نسبيًا يمكن أن يحفز التفكير الوهمي القوي لدى الأشخاص العاديين تمامًا".[7]

أُعطى هذا اسمًا لتأثير إليزا، والميل إلى افتراض أن سلوكيات الكمبيوتر دون وعي تشبه السلوكيات البشرية؛ وهذا هو، التجسيم، وهي ظاهرة موجودة في التفاعلات البشرية مع المساعدين الافتراضيين.

تم تحقيق المَعلم التالي في تطوير تقنية التعرف على الصوت في السبعينيات في جامعة كارنيجي ميلون في بيتسبرغ، بنسلفانيا بدعم كبير من وزارة الدفاع الأمريكية ووكالة داربا التابعة لها، بتمويل خمس سنوات من برنامج أبحاث فهم الكلام، بهدف للوصول إلى الحد الأدنى من المفردات البالغ 1000 كلمة. وشاركت في البرنامج شركات وأوساط أكاديمية بما في ذلك آي بي إم وجامعة كارنيجي ميلون (CMU) ومعهد ستانفورد للأبحاث.

وكانت النتيجة هي "هاربي"، التي أتقنت حوالي 1000 كلمة، مفردات طفل يبلغ من العمر ثلاث سنوات، ويمكنها فهم الجمل. كما يمكنها معالجة الكلام الذي يتبع المفردات المبرمجة مسبقًا، والنطق، والهياكل النحوية لتحديد تسلسل الكلمات المنطقي معًا، وبالتالي تقليل أخطاء التعرف على الكلام.

في عام 1986 ، كانت Tangora عبارة عن ترقية لـ Shoebox، كانت آلة كاتبة تتعرف على الصوت. تم تسميتها على اسم أسرع كاتب في العالم في ذلك الوقت، وكان يحتوي على مفردات 20000 كلمة واستخدم التنبؤ لتحديد النتيجة الأكثر احتمالية بناءً على ما قيل في الماضي. اعتمد نهج آي بي إم على نموذج نظرية ماركوف المخفية، والذي يضيف إحصائيات لتقنيات معالجة الإشارات الرقمية. تجعل هذه الطريقة من الممكن التنبؤ بأكثر الأصوات احتمالية لاتباع صوت معين. لا يزال يتعين على كل متحدث تدريب الآلة الكاتبة بشكل فردي على التعرف على صوته أو صوتها والتوقف بين كل كلمة.

ولادة المساعدين الافتراضيين الأذكياء: 1990 - حتى الآن

أصبحت تقنية التعرف على الكلام الرقمي في التسعينيات من سمات الكمبيوتر الشخصي مع قتال آي بي إم وفيليبس وLemout & Hauspie من أجل العملاء. بعد ذلك بكثير، وضع إطلاق أول هاتف ذكي المعروف بآي بي إم سمون في عام 1994 الأساس لمساعدين افتراضيين أذكياء كما نعرفهم اليوم.

في عام 1997، تمكن برنامج Dragon's Naturally Speaking من التعرف على الكلام البشري الطبيعي ونسخه دون توقف بين كل كلمة في مستند بمعدل 100 كلمة في الدقيقة. لا يزال إصدار Naturally Speaking متاحًا للتنزيل ولا يزال يستخدم حتى اليوم، على سبيل المثال، من قبل العديد من الأطباء في الولايات المتحدة والمملكة المتحدة لتوثيق سجلاتهم الطبية.

في عام 2001 ، أطلق Colloquis علنًا SmarterChild، على منصات مثل AIM و MSN Messenger. بينما كان SmarterChild المستند إلى النصوص بالكامل قادرًا على ممارسة الألعاب والتحقق من الطقس والبحث عن الحقائق والتحدث مع المستخدمين إلى حد ما.[8]

كان أول مساعد افتراضي رقمي حديث مثبت على هاتف ذكي هو سيري، والذي تم تقديمه كميزة لجهاز iPhone 4S في 4 أكتوبر 2011.[9] طورت شركة أبل. سيري بعد استحواذها عام 2010 على Siri Inc. ، وهي فرع من SRI International، وهو معهد أبحاث تموله داربا ووزارة الدفاع الأمريكية.[10] كان هدفه المساعدة في مهام مثل إرسال رسالة نصية أو إجراء مكالمات هاتفية أو التحقق من الطقس أو إعداد منبه. بمرور الوقت، تم تطويره لتقديم توصيات المطاعم والبحث في الإنترنت وتقديم اتجاهات القيادة.

في نوفمبر 2014 ، أعلنت أمازون عن أليكسا بجانب Echo.

في أبريل 2017، أصدرت أمازون خدمة لبناء واجهات محادثة لأي نوع من المساعديين الافتراضين أو الواجهة.

طريقة التفاعل

يعمل المساعدون الافتراضيون عبر:

يمكن الوصول إلى بعض المساعدين الافتراضيين عبر طرق متعددة، مثل مساعد جوجل عبر الدردشة على Google Allo وتطبيق Google Messages وعبر الصوت على مكبرات الصوت الذكية Google Home .

يستخدم المساعدون الافتراضيون معالجة اللغة الطبيعية (NLP) لمطابقة نص المستخدم أو الإدخال الصوتي مع الأوامر القابلة للتنفيذ. يتعلم الكثير باستمرار باستخدام تقنيات الذكاء الاصطناعي بما في ذلك التعلم الآلي. يتمتع بعض هؤلاء المساعدين مثل مساعد جوجل (الذي يحتوي على جوجل لنس) و Samsung Bixby أيضًا بالقدرة الإضافية على إجراء معالجة الصور للتعرف على الكائنات الموجودة في الصورة لمساعدة المستخدمين في الحصول على نتائج أفضل من الصور التي تم النقر عليها.

لتنشيط مساعد افتراضي باستخدام الصوت، يمكن استخدام كلمة تنبيه. هذه كلمة أو مجموعات كلمات مثل "Hey Siri" و "OK Google" أو "Hey Google" و "أليكسا" و "Hey Microsoft". [13] نظرًا لأن المساعدين الافتراضيين أصبحوا أكثر شيوعًا، فهناك مخاطر قانونية متزايدة. [14]

وجود الأجهزة والكائنات

يمكن دمج المساعدين الافتراضيين في العديد من أنواع المنصات أو، مثل أمازون أليكسا، عبر العديد منها:

الخدمات

يمكن للمساعدين الافتراضيين تقديم مجموعة متنوعة من الخدمات. وتشمل هذه الخدمات على:[21]

  • تقديم معلومات مثل الطقس والحقائق من على سبيل المثال ويكبيديا أو IMDb، ضبط المنبه، والقيام بعمل قوائم المهام وقوائم التسوق
  • تشغيل الموسيقى من خدمات البث مثل Spotify وPandora؛ تشغيل محطات الراديو قراءة الكتب المسموعة
  • قتشغيل مقاطع الفيديو أو البرامج التلفزيونية أو الأفلام على أجهزة التلفزيون، والبث من على سبيل المثال نيتفليكس
  • تجارة المحادثة (انظر أدناه)
  • مساعدة التفاعل العام مع الحكومة (انظر الذكاء الاصطناعي في الحكومة)
  • استكمال و/أو استبدال خدمة العملاء بالبشر.[22] قدر أحد التقارير أن مساعدًا آليًا عبر الإنترنت أنتج انخفاضًا بنسبة 30٪ في عبء العمل لمركز اتصال يوفره الإنسان.[23]

تجارة المحادثة

التجارة التحادثية هي تجارة إلكترونية عبر وسائل مختلفة للمراسلة، بما في ذلك عبر المساعدين الصوتيين[24] ولكن أيضًا الدردشة الحية على مواقع التجارة الإلكترونية على الويب، والدردشة الحية على تطبيقات المراسلة مثل وي تشات وفيسبوك ماسنجر وواتساب[25] وروبوتات الدردشة على المراسلة تطبيقات أو مواقع الويب.

دعم العملاء

يمكن للمساعد الإفتراضي العمل مع فريق دعم العملاء في الشركة لتقديم دعم على مدار الساعة طوال أيام الأسبوع للعملاء. يوفر استجابات سريعة، مما يعزز تجربة العميل.

خدمات الطرف الثالث

تعمل أمازون على تمكين "مهارات" أليكسا و "إجراءات" جوجل، وهي في الأساس تطبيقات تعمل على منصات المساعدة.

خصوصية المساعد الظاهري

المساعدين الافتراضيين لديهم مجموعة متنوعة من مخاوف الخصوصية المرتبطة بهم. تشكل الميزات مثل التنشيط الصوتي تهديدًا، حيث تتطلب هذه الميزات أن يكون الجهاز دائمًا مستمعًا.[26] تم اقتراح أنماط الخصوصية مثل زر الأمان الظاهري لإنشاء مصادقة متعددة الطبقات للمساعدين الظاهريين.[27]

سياسة الخصوصية للمساعدين الظاهريين البارزين

مساعد جوجل

لا يقوم مساعد جوجل بتخزين بياناتك دون إذنك. لتخزين الصوت، يمكنك الانتقال إلى الصوت ونشاط الصوت (VAA) وتشغيل هذه الميزة. يتم إرسال ملفاتك الصوتية إلى السحابة واستخدامها من قبل جوجل لتحسين أداء مساعد جوجل، ولكن فقط إذا قمت بتشغيل ميزة VAA. [28]

أمازون أليكسا

يستمع المساعد الافتراضي أليكسا من أمازون إلى محادثتك فقط عند استخدام كلمة التنبيه (مثل Alexa و Amazon و Echo). يبدأ تسجيل المحادثة بعد نداء كلمة تنبيه. يتوقف عن الاستماع بعد 8 ثوانٍ من الصمت. يرسل المحادثة المسجلة إلى السحابة. يمكنك حذف التسجيل الخاص بك من السحابة عن طريق زيارة "Alexa Privacy" في "Alexa". يمكنك منع أليكسا من الاستماع إلى محادثاتك باستخدام ميزة "كتم الصوت" في أليكسا، بعد كتم صوت الجهاز، لا يمكنه الاستماع إليك حتى إذا كنت تستخدم كلمات التنبيه (مثل Alexa). [29]

سيري

لا تقوم أبل بتسجيل الصوت الخاص بك لتحسين سيري، بل تستخدم النصوص بدلاً من ذلك. يرسل فقط البيانات المهمة للتحليل، على سبيل المثال، إذا طلبت من سيري قراءة رسالتك، فلن ترسل الرسالة إلى السحابة، وسيقوم الجهاز بقراءة الرسالة مباشرة دون تدخل الخادم. يمكن للمستخدمين إلغاء الاشتراك في أي وقت إذا كانوا لا يريدون من سيري إرسال النصوص في السحابة. [30]

الاهتمام المفترض والملاحظ للمستهلك

القيمة المضافة المفترضة تتيح طريقة جديدة للتفاعل

يمكن أن تأتي القيمة المضافة للمساعدين الافتراضيين من بين أمور أخرى مما يلي:

  1. الملائمة: هناك بعض القطاعات حيث يكون الصوت هو الطريقة الوحيدة للتواصل الممكن، وبشكل أكثر عمومية، فهو يسمح بتحرير اليدين والرؤية بشكل محتمل للقيام بنشاط آخر بالتوازي، أو يساعد أيضًا الأشخاص ذوي الإعاقة.
  2. السرعة: الصوت أكثر فعالية من الكتابة على لوحة المفاتيح: يمكننا التحدث حتى 200 كلمة في الدقيقة مقابل 60 كلمة في حالة الكتابة على لوحة المفاتيح. كما أنه أكثر طبيعية وبالتالي يتطلب جهدًا أقل (قراءة النص يمكن أن تصل إلى 700 كلمة في الدقيقة). [31]
  • يوفر المساعدون الافتراضيون الكثير من الوقت عن طريق الأتمتة: يمكنهم أخذ المواعيد أو قراءة الأخبار بينما يقوم المستهلك بعمل شيء آخر. من الممكن أيضًا أن تطلب من المساعد الافتراضي جدولة الاجتماعات، وبالتالي المساعدة في تنظيم الوقت. أوضح مصممو المجدولين الرقميين الجدد طموحهم في أن تكون هذه التقاويم على قيد الحياة لجعل المستهلك يستخدم وقته بشكل أكثر كفاءة، من خلال عمليات التعلم الآلي، والتنظيم الكامل لوقت العمل ووقت الفراغ. كمثال عندما يعبر المستهلك عن رغبته في جدولة استراحة، فإن VA ستحدده في اللحظة المثلى لهذا الغرض (على سبيل المثال في وقت من الأسبوع حيث يكونون أقل إنتاجية)، مع الهدف الإضافي طويل الأجل المتمثل في قادر على جدولة وتنظيم وقت الفراغ للمستهلك، لضمان كفاءة العمل المثلى لهم.[32]

الفائدة المتصورة

ملخص رسومي للدراسة يوضح أسباب اهتمام المساعدين الافتراضيين للمستهلكين
  • وفقًا لدراسة حديثة (2019)، فإن السببين لاستخدام المساعدين الافتراضيين للمستهلكين هما الفائدة المتصورة والمتعة المتصورة. النتيجة الأولى لهذه الدراسة هي أن كلاً من الفائدة المتصورة والمتعة المتصورة لهما تأثير قوي مكافئ على رغبة المستهلك في استخدام المساعد الافتراضي.
  • النتيجة الثانية لهذه الدراسة هي أن:
  1. جودة المحتوى المقدمة لها تأثير قوي للغاية على الفائدة المتصورة وتأثير قوي على التمتع المتصور.
  2. الجاذبية البصرية لها تأثير قوي للغاية على التمتع المتصور.
  3. الأتمتة لها تأثير قوي على الفائدة المتصورة. [33]

خلافات الذكاء الاصطناعي

  • يحفز المساعدون الافتراضيون فقاعة التصفية: بالنسبة إلى وسائل التواصل الاجتماعي، يتم تدريب خوارزميات المساعدين الظاهريين على إظهار البيانات ذات الصلة وتجاهل البيانات الأخرى بناءً على الأنشطة السابقة للمستخدم كون البيانات ذات الصلة هي التي ستثير اهتمام المستخدم أو ترضيه. ونتيجة لذلك، يصبح المستخدمون معزولين عن البيانات التي لا تتفق مع وجهات نظرهم، مما يعزلهم بشكل فعال في فقاعتهم الفكرية الخاصة، ويعززون آرائهم. عُرف عن هذه الظاهرة أنها تعزز الأخبار المزيفة وغرف الصدى. [34]
  • يتم أحيانًا انتقاد المساعدين الافتراضيون لكونهم مبالغًا في تقديرهم. على وجه الخصوص، يشير A. Casilli إلى أن الذكاء الاصطناعي للمساعدات الافتراضية ليس ذكيًا ولا مصطنعًا لسببين:
  1. ليسوا أذكياء لأن كل ما يفعلونه هو كونهم مساعدًا للإنسان، وفقط من خلال القيام بالمهام التي يمكن للإنسان القيام بها بسهولة، وفي نطاق محدود جدًا من الإجراءات: العثور على المعلومات أو العروض أو المستندات وتصنيفها وتقديمها. أيضًا، لا يستطيع المساعدون الافتراضيون اتخاذ القرارات بمفردهم أو توقع الأشياء.
  2. وليسوا مصطنعين لأن عملهم مستحيل بدون تصنيف بشري من خلال العمل الجزئي.[35]

الآثار الأخلاقية

في عام 2019 انتقد أنطونيو أ.كاسيلي، عالم الاجتماع الفرنسي، الذكاء الاصطناعي والمساعدين الافتراضيين على وجه الخصوص بالطريقة التالية:

في المستوى الأول، حقيقة أن المستهلك يوفر بيانات مجانية لتدريب وتحسين المساعد الافتراضي، غالبًا دون معرفة ذلك، أمر مزعج من الناحية الأخلاقية.

ولكن في المستوى الثاني، قد يكون الأمر مزعجًا أكثر من الناحية الأخلاقية لمعرفة كيفية تدريب أنظمة الذكاء الاصطناعي هذه على هذه البيانات.

يتم تدريب هذا الذكاء الاصطناعي عبر الشبكات العصبية، والتي تتطلب كمية هائلة من البيانات المصنفة. ومع ذلك، يجب تسمية هذه البيانات من خلال عملية بشرية، وهو ما يفسر ظهور الأعمال الصغيرة في العقد الماضي. وهذا يعني، استخدام بعض الأشخاص في جميع أنحاء العالم عن بُعد للقيام ببعض المهام المتكررة والبسيطة جدًا مقابل بضعة سنتات، مثل الاستماع إلى بيانات الكلام في المساعد الإفتراضي وتدوين ما قيل. تعرضت شركة Microwork لانتقادات بسبب انعدام الأمن الوظيفي الذي تسببه، وبسبب الافتقار التام إلى التنظيم: كان متوسط الراتب 1,38 دولارًا / ساعة في عام 2010،[36] ولا يوفر مزايا الرعاية الصحية ولا مزايا التقاعد والأجر المرضي والحد الأدنى للأجور. بالتالي، فإن المساعدين الافتراضيين ومصمميهم مثيرون للجدل لإثارة انعدام الأمن الوظيفي، والذكاء الاصطناعي الذي يقترحونه لا يزال بشريًا بطريقة سيكون بها مستحيلا بدون العمل الصغير لملايين العاملين البشريين.[35]

تثار مخاوف الخصوصية من خلال حقيقة أن الأوامر الصوتية متاحة لموفري المساعدين الظاهريين في شكل غير مشفر، وبالتالي يمكن مشاركتها مع أطراف ثالثة ومعالجتها بطريقة غير مصرح بها أو غير متوقعة.[37] بالإضافة إلى المحتوى اللغوي للكلام المسجل، يمكن أن تحتوي طريقة تعبير المستخدم وخصائصه الصوتية ضمنيًا على معلومات حول هويته أو هويتها البيومترية، وسمات الشخصية وشكل الجسم وحالة الصحة البدنية والعقلية والجنس والحالات المزاجية والعواطف والحالة الاجتماعية والاقتصادية والأصل الجغرافي. [38]

منصات المطورين

تشمل منصات المطورين البارزة للمساعدين الافتراضيين ما يلي:

  • تم فتح Amazon Lex للمطورين في أبريل 2017. تتضمن تقنية فهم اللغة الطبيعية جنبًا إلى جنب مع التعرف التلقائي على الكلام وتم تقديمها في نوفمبر 2016.[39]
  • توفر جوجل الإجراءات على جوجل ومنصات Dialogflow للمطورين لإنشاء "إجراءات" لمساعد جوجل.[40]
  • توفر Apple SiriKit للمطورين لإنشاء ملحقات لسيري
  • واتسون من شركة آي بي إم، على الرغم من الحديث عنه في بعض الأحيان كمساعد افتراضي، فهو في الواقع نظام أساسي كامل للذكاء الاصطناعي ومجتمع يدعم بعض المساعدين الافتراضيين وروبوتات المحادثة والعديد من أنواع الحلول الأخرى.[41] [42]

الأجيال السابقة

في الأجيال السابقة من المساعدين الافتراضيين المستندين إلى الدردشة النصية، غالبًا ما كان يتم تمثيل المساعد بواسطة صورة رمزية (تُعرف أيضًا بشخصية تفاعلية عبر الإنترنت أو شخصية آلية) - كان هذا يُعرف باسم الوكيل المتجسد .

الأهمية الاقتصادية

للأفراد

تعتبر التجارب الرقمية التي تم تمكينها بواسطة المساعدين الافتراضيين من بين التطورات التكنولوجية الحديثة الرئيسية واتجاهات المستهلك الواعدة. يدعي الخبراء أن التجارب الرقمية ستحقق ثقلًا للوضع يمكن مقارنته بالتجارب "الحقيقية"، إذا لم تصبح أكثر طلبًا وقيمة. [43] تم التحقق من هذا الاتجاه من خلال عدد كبير من المستخدمين المتكررين والنمو الكبير في أعداد المستخدمين العالميين للمساعدين الرقميين الظاهريين. في منتصف عام 2017، يقدر عدد المستخدمين المتكررين للمساعدين الافتراضيين الرقميين بحوالي 1 مليار في جميع أنحاء العالم.[44] بالإضافة إلى ذلك، يمكن ملاحظة أن تقنية المساعد الرقمي الافتراضي لم تعد مقتصرة على تطبيقات الهواتف الذكية، ولكنها موجودة في العديد من قطاعات الصناعة (بما في ذلك السيارات والاتصالات والبيع بالتجزئة والرعاية الصحية والتعليم).[45] استجابةً لنفقات البحث والتطوير الكبيرة للشركات في جميع القطاعات والتنفيذ المتزايد للأجهزة المحمولة، من المتوقع أن ينمو سوق تقنية التعرف على الكلام بمعدل نمو سنوي مركب يبلغ 34.9٪ على مستوى العالم خلال الفترة من 2016 إلى 2024 وبالتالي يتجاوز السوق العالمي حجم 7.5 مليار دولار أمريكي بحلول عام 2024. وفقًا لدراسة أجرتها شركة Ovum، من المتوقع أن تتجاوز "القاعدة المثبتة للمساعد الرقمي الأصلي" سكان العالم بحلول عام 2021، مع 7.5 مليار جهاز صوتي نشط قادر على استخدام الذكاء الاصطناعي. [46] وفقًا لـ Ovum، بحلول ذلك الوقت، "سيهيمن مساعد جوجل على سوق الأجهزة التي تدعم الذكاء الاصطناعي الصوتي بنسبة 23.3٪ من حصة السوق، يليه Bixby من سامسونج (14.5٪)، وسيري من أبل (13.1٪)، وأليكسا من أمازون (3.9٪)، ومايكروسوفت كورتانا (2.3٪)".

مع الأخذ في الاعتبار التوزيع الإقليمي لقادة السوق، من المتوقع أن تهيمن شركات أمريكا الشمالية (على سبيل المثال Nuance Communications وIBM و eGain) على الصناعة على مدار السنوات القادمة، نظرًا للتأثير الكبير لـ BYOD (أحضر جهازك الخاص) ونماذج أعمال التنقل الخاصة بالمؤسسات. علاوة على ذلك، من المتوقع أن يؤدي الطلب المتزايد على المنصات التي تدعم الهواتف الذكية إلى تعزيز نمو صناعة المساعد الافتراضي الذكي (IVA) في أمريكا الشمالية. على الرغم من حجمها الأصغر مقارنة بسوق أمريكا الشمالية، فمن المتوقع أن تنمو صناعة المساعد الافتراضي الذكي من منطقة آسيا والمحيط الهادئ، مع وجود لاعبين رئيسيين في الهند والصين، بمعدل نمو سنوي يبلغ 40٪ (أعلى من المتوسط العالمي) خلال الفترة من 2016 إلى 2024.[45]

فرصة اقتصادية للمؤسسات

لا ينبغي النظر إلى المساعدين الافتراضيين كأداة للأفراد فقط، حيث يمكن أن يكون لديهم فائدة اقتصادية حقيقية للمؤسسات. على سبيل المثال، يمكن أن يقوم المساعد الافتراضي بدور المساعد المتاح دائمًا بمعرفة موسوعية. والتي يمكنها تنظيم الاجتماعات والتحقق من قوائم الجرد والتحقق من المعلومات. يعتبر المساعدون الافتراضيون أكثر أهمية ودمجهم في المؤسسات الصغيرة والمتوسطة الحجم غالبًا ما يتكون من خطوة أولى سهلة من خلال المزيد من التكيف العالمي واستخدام إنترنت الأشياء (IoT). في الواقع، تُدرك الشركات الصغيرة والمتوسطة الحجم تقنيات إنترنت الأشياء على أنها تقنيات ذات أهمية بالغة، ولكنها معقدة للغاية أو محفوفة بالمخاطر أو باهظة التكلفة لاستخدامها.[47]

الأمان

في مايو 2018، نشر باحثون من جامعة كاليفورنيا في بيركلي ورقة بحثية أظهرت أن الأوامر الصوتية التي لا يمكن اكتشافها للأذن البشرية يمكن دمجها مباشرة في الموسيقى أو النص المنطوق، وبالتالي التلاعب بالمساعدين الافتراضيين لأداء إجراءات معينة دون أن يلاحظ المستخدم ذلك.[48] قام الباحثون بإجراء تغييرات طفيفة على الملفات الصوتية، والتي ألغت أنماط الصوت التي تهدف أنظمة التعرف على الكلام إلى اكتشافها. تم استبدالها بأصوات يمكن للنظام تفسيرها بشكل مختلف وتطلب منه الاتصال بأرقام الهواتف أو فتح مواقع الويب أو حتى تحويل الأموال. يُعرف احتمال حدوث ذلك منذ عام 2016، ويؤثر على أجهزة من أبل وأمازون وجوجل.[49]

بالإضافة إلى الإجراءات غير المقصودة والتسجيل الصوتي، هناك مخاطر أخرى تتعلق بالأمان والخصوصية مرتبطة بالمساعدين الافتراضيين الأذكياء وهي الأوامر الصوتية الخبيثة: المهاجم الذي ينتحل شخصية مستخدم ويصدر أوامر صوتية ضارة، على سبيل المثال، لفتح باب ذكي للحصول على دخول غير مصرح به إلى المنزل أو المرآب أو طلب العناصر عبر الإنترنت دون علم المستخدم. على الرغم من أن بعض المساعدين الافتراضيين يقومون بتوفير ميزة تدريب صوتي لمنع مثل هذا الانتحال، فقد يكون من الصعب على النظام التمييز بين الأصوات المتشابهة. وبالتالي، قد يتمكن الشخص الخبيث القادر على الوصول إلى جهاز يدعم المساعد الإفتراضي من خداع النظام ليعتقد أنه المالك الحقيقي ويقوم بأعمال إجرامية أو مؤذية. [50]

انظر أيضًا

المراجع

  1. Hoy, Matthew B. (2018). "Alexa, Siri, Cortana, and More: An Introduction to Voice Assistants". Medical Reference Services Quarterly. 37 (1): 81–88. doi:10.1080/02763869.2018.1404391. PMID 29327988. الوسيط |CitationClass= تم تجاهله (مساعدة)
  2. Klüwer, Tina. "From chatbots to dialog systems." Conversational agents and natural language interaction: Techniques and Effective Practices. IGI Global, 2011. 1–22.
  3. Daniel B. Kline (30 January 2017). "Alexa, How Big Is Amazon's Echo?". The Motley Fool. مؤرشف من الأصل في 26 يوليو 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  4. Krazit, Tom. "Google finding its voice". CNET (باللغة الإنجليزية). مؤرشف من الأصل في 5 يناير 2021. اطلع عليه بتاريخ 23 أكتوبر 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  5. Moskvitch, Katia. "The machines that learned to listen". www.bbc.com (باللغة الإنجليزية). مؤرشف من الأصل في 31 ديسمبر 2020. اطلع عليه بتاريخ 05 مايو 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  6. Epstein, J; Klinkenberg, W. D (1 May 2001). "From Eliza to Internet: a brief history of computerized assessment". Computers in Human Behavior (باللغة الإنجليزية). 17 (3): 295–314. doi:10.1016/S0747-5632(01)00004-8. ISSN 0747-5632. مؤرشف من الأصل في 11 يونيو 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  7. Weizenbaum, Joseph (1976). Computer power and human reason : from judgment to calculation. Oliver Wendell Holmes Library Phillips Academy. San Francisco : W. H. Freeman. الوسيط |CitationClass= تم تجاهله (مساعدة)
  8. "Smartphone: your new personal assistant – Orange Pop". 10 July 2017. مؤرشف من الأصل في 10 يوليو 2017. اطلع عليه بتاريخ 05 مايو 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  9. Darren Murph (4 October 2011). "iPhone 4S hands-on!". Engadget.com. مؤرشف من الأصل في 26 يناير 2021. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  10. "Feature: Von IBM Shoebox bis Siri: 50 Jahre Spracherkennung – WELT" [From IBM Shoebox to Siri: 50 years of speech recognition]. Die Welt (باللغة الألمانية). Welt.de. 20 April 2012. مؤرشف من الأصل في 24 سبتمبر 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  11. "Conversica Raises $31 Million in Series C Funding to Fuel Expansion of Conversational AI for Business". Bloomberg.com (باللغة الإنجليزية). 2018-10-30. مؤرشف من الأصل في 14 أكتوبر 2019. اطلع عليه بتاريخ 23 أكتوبر 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  12. Herrera, Sebastian. "Amazon Extends Alexa's Reach Into Wearables". WSJ (باللغة الإنجليزية). مؤرشف من الأصل في 8 سبتمبر 2020. اطلع عليه بتاريخ 26 سبتمبر 2019. الوسيط |CitationClass= تم تجاهله (مساعدة)
  13. "S7617 – Developing Your Own Wake Word Engine Just Like 'Alexa' and 'OK Google'". GPU Technology Conference. مؤرشف من الأصل في 30 نوفمبر 2020. اطلع عليه بتاريخ 17 يوليو 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  14. Van Loo, Rory (2019-03-01). "Digital Market Perfection". Michigan Law Review. 117 (5): 815. مؤرشف من الأصل في 26 يناير 2021. الوسيط |CitationClass= تم تجاهله (مساعدة)
  15. Lynn La (27 February 2017). "Everything Google Assistant can do on the Pixel". CNET. مؤرشف من الأصل في 18 يناير 2021. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  16. Morrison, Maureen (5 October 2014). "Domino's Pitches Voice-Ordering App in Fast-Food First | CMO Strategy". AdAge. مؤرشف من الأصل في 17 أغسطس 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  17. Dan O'Shea (4 January 2017). "LG introduces smart refrigerator with Amazon Alexa-enabled grocery ordering". Retail Dive. مؤرشف من الأصل في 7 أغسطس 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  18. Samuel Gibbs (7 February 2017). "Amazon's Alexa escapes the Echo and gets into cars | Technology". The Guardian. مؤرشف من الأصل في 12 نوفمبر 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  19. "What is Google Assistant, how does it work, and which devices offer it?". Pocket-lint. 6 October 2017. مؤرشف من الأصل في 31 أكتوبر 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  20. ""Ask Jenn", Alaska Airlines website". Alaskaair.com. 2 January 2017. مؤرشف من الأصل في 30 يوليو 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  21. Taylor Martin; David Priest (10 September 2017). "The complete list of Alexa commands so far". CNET. مؤرشف من الأصل في 30 ديسمبر 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  22. Kongthon, Alisa; Sangkeettrakarn, Chatchawal; Kongyoung, Sarawoot; Haruechaiyasak, Choochart (1 January 2009). Implementing an Online Help Desk System Based on Conversational Agent. Proceedings of the International Conference on Management of Emergent Digital EcoSystems. New York, NY, USA: ACM. صفحات 69:450–69:451. doi:10.1145/1643823.1643908. ISBN 9781605588292. الوسيط |CitationClass= تم تجاهله (مساعدة)
  23. Anthony O'Donnell (3 June 2010). "Aetna's new "virtual online assistant"". Insurance & Technology. مؤرشف من الأصل في 07 يونيو 2010. الوسيط |CitationClass= تم تجاهله (مساعدة)
  24. "How to prepare your products and brand for conversational commerce". 6 March 2018. مؤرشف من الأصل في 29 سبتمبر 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  25. Taylor, Glenn. "Retail's Big Opportunity: 87% Of U.S. Consumers Grasp The Power Of Conversational Commerce – Retail TouchPoints". مؤرشف من الأصل في 4 أغسطس 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  26. Zhang, Guoming; Yan, Chen; Ji, Xiaoyu; Zhang, Tianchen; Zhang, Taimin; Xu, Wenyuan (2017). "DolphinAttack". Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security - CCS '17. صفحات 103–117. arXiv:1708.09537. doi:10.1145/3133956.3134052. ISBN 9781450349468. الوسيط |CitationClass= تم تجاهله (مساعدة)
  27. Lei. "The Insecurity of Home Digital Voice Assistants – Amazon Alexa as a Case Study". الوسيط |CitationClass= تم تجاهله (مساعدة); |arxiv= required (مساعدة)
  28. "Doing more to protect your privacy with the Assistant". Google (باللغة الإنجليزية). 23 September 2019. مؤرشف من الأصل في 12 ديسمبر 2020. اطلع عليه بتاريخ 27 فبراير 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  29. "Amazon.com Help: Alexa, Echo Devices, and Your Privacy". www.amazon.com. مؤرشف من الأصل في 26 يناير 2021. اطلع عليه بتاريخ 27 فبراير 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  30. "Improving Siri's privacy protections". Apple Newsroom (باللغة الإنجليزية). مؤرشف من الأصل في 9 سبتمبر 2020. اطلع عليه بتاريخ 27 فبراير 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  31. Minker, W.; Néel, F. (2002). "Développement des technologies vocales". Le Travail Humain. 65 (3): 261. doi:10.3917/th.653.0261. ISSN 0041-1868. الوسيط |CitationClass= تم تجاهله (مساعدة)
  32. Wajcman, Judy (2019). "The Digital Architecture of time Management" (PDF). Science, Technology, & Human Values. 44 (2): 315–337. doi:10.1177/0162243918795041. مؤرشف من الأصل (PDF) في 26 نوفمبر 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  33. Yang, Heetae; Lee, Hwansoo (26 June 2018). "Understanding user behavior of virtual personal assistant devices". Information Systems and E-Business Management. 17 (1): 65–87. doi:10.1007/s10257-018-0375-1. ISSN 1617-9846. الوسيط |CitationClass= تم تجاهله (مساعدة)
  34. Tisseron, Serge (2019). "La famille sous écoute". L'École des Parents. n° 632 (3): 16. doi:10.3917/epar.632.0016. ISSN 0424-2238. الوسيط |CitationClass= تم تجاهله (مساعدة)
  35. Casilli, Antonio A. (2019). En attendant les robots. Enquête sur le travail du clic. Editions Seuil. ISBN 978-2-02-140188-2. OCLC 1083583353. الوسيط |CitationClass= تم تجاهله (مساعدة)
  36. Horton, John Joseph; Chilton, Lydia B. (2010). "The labor economics of paid crowdsourcing". ACM Press. New York, New York, USA: 209. doi:10.1145/1807342.1807376. ISBN 978-1-60558-822-3. الوسيط |CitationClass= تم تجاهله (مساعدة)
  37. "Apple, Google, and Amazon May Have Violated Your Privacy by Reviewing Digital Assistant Commands". Fortune. 2019-08-05. مؤرشف من الأصل في 27 نوفمبر 2020. اطلع عليه بتاريخ 13 مايو 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  38. Kröger, Jacob Leon; Lutz, Otto Hans-Martin; Raschke, Philip (2020). "Privacy Implications of Voice and Speech Analysis – Information Disclosure by Inference". 576: 242–258. doi:10.1007/978-3-030-42504-3_16. ISSN 1868-4238. الوسيط |CitationClass= تم تجاهله (مساعدة); Cite journal requires |journal= (مساعدة)
  39. "Amazon Lex, the technology behind Alexa, opens up to developers". TechCrunch. 20 April 2017. مؤرشف من الأصل في 11 نوفمبر 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  40. "Actions on Google | Google Developers". مؤرشف من الأصل في 27 يناير 2021. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  41. "Watson – Stories of how AI and Watson are transforming business and our world". Ibm.com. مؤرشف من الأصل في 1 فبراير 2021. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  42. Memeti, Suejb; Pllana, Sabri (January 2018). "PAPA: A parallel programming assistant powered by IBM Watson cognitive computing technology". Journal of Computational Science. 26: 275–284. doi:10.1016/j.jocs.2018.01.001. الوسيط |CitationClass= تم تجاهله (مساعدة)
  43. "5 Consumer Trends for 2017". TrendWatching. 31 October 2016. مؤرشف من الأصل في 21 يناير 2021. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  44. Felix Richter (26 August 2016). "Chart: Digital Assistants – Always at Your Service". Statista. مؤرشف من الأصل في 23 أكتوبر 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  45. "Virtual Assistant Industry Statistics « Global Market Insights, Inc". Gminsights.wordpress.com. 30 January 2017. مؤرشف من الأصل في 17 أغسطس 2020. اطلع عليه بتاريخ 10 ديسمبر 2017. الوسيط |CitationClass= تم تجاهله (مساعدة)
  46. "Virtual digital assistants to overtake world population by 2021". ovum.informa.com (باللغة الإنجليزية). مؤرشف من الأصل في 06 نوفمبر 2019. اطلع عليه بتاريخ 11 مايو 2018. الوسيط |CitationClass= تم تجاهله (مساعدة)
  47. Jones, Nory B.; Graham, C. Matt (February 2018). "Can the IoT Help Small Businesses?". Bulletin of Science, Technology & Society. 38 (1–2): 3–12. doi:10.1177/0270467620902365. ISSN 0270-4676. الوسيط |CitationClass= تم تجاهله (مساعدة)
  48. "Alexa and Siri Can Hear This Hidden Command. You Can't". The New York Times (باللغة الإنجليزية). 10 May 2018. ISSN 0362-4331. مؤرشف من الأصل في 25 يناير 2021. اطلع عليه بتاريخ 11 مايو 2018. الوسيط |CitationClass= تم تجاهله (مساعدة)
  49. "As voice assistants go mainstream, researchers warn of vulnerabilities". CNET (باللغة الإنجليزية). 10 May 2018. مؤرشف من الأصل في 9 نوفمبر 2020. اطلع عليه بتاريخ 11 مايو 2018. الوسيط |CitationClass= تم تجاهله (مساعدة)
  50. Chung, H.; Iorga, M.; Voas, J.; Lee, S. (2017). "Alexa, Can I Trust You?". Computer. 50 (9): 100–104. doi:10.1109/MC.2017.3571053. ISSN 0018-9162. PMID 29213147. الوسيط |CitationClass= تم تجاهله (مساعدة)
    • بوابة شركات
    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.