تعرف على معلومات حول الذكاء الاصطناعي مع Andrew Ng ، مؤسس Google Brain and Landing AI


تم اختصار هذه المقابلة وتحريرها قليلاً من أجل التوضيح.

MIT Technology Review: أنا متأكد من أن الناس يسألونك غالبًا ، “كيف أبدأ نشاطًا تجاريًا باستخدام الذكاء الاصطناعي؟” ماذا تقول عادة؟

Andrew Ng: عادة ما أقول ، “لا تفعل ذلك.” إذا ذهبت إلى فريق وقلت ، “مرحبًا ، جميعًا ، من فضلك كن أول من يعمل في مجال الذكاء الاصطناعي” ، فهذا يميل إلى تركيز الفريق على التكنولوجيا ، والتي يمكن أن تكون رائعة لمختبر الأبحاث. ولكن عندما يتعلق الأمر بكيفية إدارة الأعمال ، فأنا أميل إلى أن أكون مدفوعة بالعملاء أو المهام ، ولا أكون مدفوعًا بالتكنولوجيا أبدًا.

لديك الآن هذه الشركة الجديدة المسماة Landing AI. هل يمكنك إخبارنا قليلاً عن ماهيته ولماذا قررت العمل عليه؟

بعد قيادة فرق الذكاء الاصطناعي في Google و Baidu ، أدركت أن الذكاء الاصطناعي قد حول مستهلك الإنترنت للبرامج ، مثل البحث على الويب والإعلان عبر الإنترنت. لكنني أردت أن أجلب الذكاء الاصطناعي إلى جميع الصناعات الأخرى ، والتي تعد جزءًا أكبر من الاقتصاد. لذلك بعد النظر في العديد من الصناعات المختلفة ، قررت التركيز على التصنيع. أعتقد أن العديد من الصناعات جاهزة للذكاء الاصطناعي ، لكن أحد أنماط الصناعة لتكون أكثر استعدادًا للذكاء الاصطناعي هو ما إذا كانت قد خضعت لأي تحول رقمي ، لذلك هناك بعض البيانات. هذا يخلق فرصة لفرق الذكاء الاصطناعي لاستخدام البيانات لخلق قيمة.

لذا فإن أحد المشاريع التي أثارت حماستي مؤخرًا هو إجراء عمليات الفحص البصري. هل يمكنك رؤية صورة هاتف ذكي يخرج من خط التصنيع ومعرفة ما إذا كان هناك أي عيوب؟ أو انظر إلى أحد المكونات التلقائية لمعرفة ما إذا كان هناك أي نوابض؟ يوجد فرق كبير في برامج الإنترنت الاستهلاكية ، فقد يكون لديك مليار مستخدم والكثير من البيانات. لكن في التصنيع ، لم ينتج أي مصنع مليار أو حتى مليون هاتف ذكي مخدوش. الحمد لله على ذلك. لذا فإن التحدي هو: هل يمكنك جعل ذكاء اصطناعي يعمل بمئة صورة؟ اتضح أنه يمكنك في كثير من الأحيان. في الواقع ، لقد فوجئت كثيرًا بمدى ما يمكن القيام به حتى مع كميات متواضعة من البيانات. لذا في حين أن كل الضجيج والإثارة والعلاقات العامة حول الذكاء الاصطناعي موجودة في مجموعات البيانات العملاقة ، أشعر أننا بحاجة أيضًا إلى توفير مساحة كبيرة لفتح هذه التطبيقات الأخرى حيث تكون التحديات مختلفة تمامًا.

كيف تقوم بذلك؟

خطأ شائع جدًا أراه من قبل الرؤساء التنفيذيين ورؤساء قسم المعلومات: لقد أخبروني شيئًا مثل “مرحبًا ، أندرو ، ليس لدينا الكثير من البيانات ، بياناتي كارثة. أعطني عامين لبناء بنية تحتية رائعة لتكنولوجيا المعلومات. ثم سيكون لدينا كل هذه البيانات الرائعة التي نبني عليها الذكاء الاصطناعي. أقول دائمًا ، “هذا خطأ. لاتفعل ذلك “. بادئ ذي بدء ، أعتقد أنه لا توجد شركة على هذا الكوكب اليوم (ربما ولا حتى عمالقة التكنولوجيا) تعتقد أن بياناتهم نظيفة تمامًا ومثالية. إنها رحلة. إن قضاء عامين أو ثلاثة أعوام في بناء بنية أساسية جميلة للبيانات يعني أنك تفتقر إلى التعليقات الواردة من فريق الذكاء الاصطناعي للمساعدة في تحديد أولويات البنية التحتية لتكنولوجيا المعلومات التي ترغب في بنائها.

على سبيل المثال ، إذا كان لديك الكثير من المستخدمين ، فهل يجب أن تعطي الأولوية لطرح أسئلة عليهم في استطلاع للحصول على مزيد من البيانات؟ أو في مصنع ، هل يجب أن تعطي الأولوية لترقية المستشعر من شيء يسجل الاهتزازات 10 مرات في الثانية إلى 100 مرة في الثانية؟ غالبًا ما تبدأ في تنفيذ مشروع الذكاء الاصطناعي بالبيانات التي لديك بالفعل والتي تسمح لفريق الذكاء الاصطناعي بتزويدك بالتعليقات للمساعدة في تحديد أولويات البيانات الإضافية التي سنجمعها.

في الصناعات التي لا يتوفر فيها مقياس الإنترنت لبرامج المستهلك ، أعتقد أننا بحاجة إلى تغيير طريقة تفكيرنا عظيم البيانات أ نحن سوف بيانات. إذا كان لديك مليون صورة ، فاستمر في استخدامها ، فهذا رائع. ولكن هناك العديد من المشكلات التي يمكن أن تستخدم مجموعات بيانات أصغر بكثير ومُصنفة بعناية ومعالجة بعناية.

هل يمكن أن تعطي مثالا؟ ماذا يعني ذلك مع البيانات الجيدة؟

اسمحوا لي أن أقدم مثالاً على التعرف على الصوت. عندما عملت مع البحث الصوتي ، حصلت على مقاطع صوتية حيث سمعت أحدهم يقول ، “حان وقت اليوم”. السؤال هو: ما هو النص الصحيح لهذا المقطع الصوتي؟ هل “أم (فاصلة) وقت اليوم” أم “أم (نقطة ، نقطة ، نقطة) وقت اليوم” أم “أم” شيء لا نكتبه؟ اتضح أن أيًا من هؤلاء جيد ، ولكن الشيء غير الصحيح هو أن الناسخين المختلفين يستخدمون كلًا من اصطلاحات وضع العلامات الثلاثة. ثم تصبح بياناتك صاخبة وتضر بنظام التعرف على الصوت. الآن ، عندما يكون لديك الملايين أو المليارات من المستخدمين ، يمكنك الحصول على هذه البيانات الصاخبة ومتوسطها: ستعمل خوارزمية التعلم بشكل جيد. ولكن إذا كنت في بيئة بها مجموعة بيانات أصغر (على سبيل المثال ، مائة مثال) ، فإن هذا النوع من البيانات المزعجة له ​​تأثير كبير على الأداء.

مثال آخر على التصنيع: قمنا بالكثير من العمل في فحص الفولاذ. إذا كنت تقود سيارة ، فإن جانب السيارة مصنوع بالفعل من صفائح فولاذية. في بعض الأحيان توجد تجاعيد صغيرة في الفولاذ ، أو تكون هناك خدوش أو بقع صغيرة. لذلك ، يمكنك استخدام الكاميرا وعرض الكمبيوتر لمعرفة ما إذا كان هناك أي عيوب أم لا. لكن واضعين مختلفين سيصنفون البيانات بشكل مختلف سيضع البعض مربع حدود عملاقًا في جميع أنحاء المنطقة. سيضع البعض مربعات حدودية صغيرة حول الجسيمات الصغيرة. عندما يكون لديك مجموعة بيانات متواضعة ، تأكد من قيام مفتشي الجودة المختلفين بتسمية البيانات بشكل متسق ، والذي تبين أنه أحد أهم الأشياء.

بالنسبة للعديد من مشاريع الذكاء الاصطناعي ، فإن نموذج المصدر المفتوح الذي تقوم بتنزيله من GitHub – الشبكة العصبية التي يمكنك الحصول عليها من الأدبيات – جيد بما فيه الكفاية. ليس كل المشاكل ، ولكن المشاكل الرئيسية. لذلك ذهبت إلى الكثير من فريقي وقلت ، “مرحبًا ، جميعًا ، الشبكة العصبية جيدة بما يكفي. دعونا لا نخدع أنفسنا بعد الآن بالكود. كل ما عليك فعله الآن هو إنشاء عمليات لتحسين جودة البيانات “. واتضح أنه غالبًا ما يؤدي إلى تحسينات أسرع في أداء الخوارزمية.

ما حجم البيانات الذي تفكر فيه عندما تقول مجموعات بيانات أصغر؟ هل تتحدث عن مائة مثال؟ عشرة أمثلة؟

يتسم التعلم الآلي بالتنوع لدرجة أنه أصبح من الصعب جدًا تقديم إجابات ذات مقاس واحد يناسب الجميع. لقد عملت على قضايا حيث كان لدي ما بين 200 و 300 مليون صورة. لقد عملت أيضًا على مشكلات حيث كان لدي 10 صور وكل شيء بينهما. عندما أنظر إلى تطبيقات التصنيع ، أعتقد أن شيئًا مثل العشرات أو ربما مئات الصور لفئة من العيوب ليس أمرًا غير معتاد ، ولكن هناك تباين واسع جدًا حتى في المصنع.

يبدو لي أن ممارسات الذكاء الاصطناعي تتغير عندما تقل أحجام مجموعة التدريب ، على سبيل المثال ، 10000 مثال ، لأنها نوع من العتبة حيث يمكن للمهندس أن ينظر بشكل أساسي إلى كل مثال ويصممه بنفسه.

كنت أتحدث مؤخرًا مع مهندس جيد جدًا في إحدى شركات التكنولوجيا الكبرى. وسألت ، “مرحبًا ، ماذا تفعل إذا كانت التسميات غير متسقة؟” وقال ، “حسنًا ، لدينا هذا الفريق المكون من مئات الأشخاص في الخارج يقومون بوضع العلامات. لذلك ، سأكتب تعليمات وضع العلامات ، وسأطلب من ثلاثة أشخاص تسمية جميع الصور ثم أخذ معدل “. وقلت ، “نعم ، هذا ما عليك فعله عندما يكون لديك مجموعة بيانات عملاقة.” لكن عندما أعمل مع فريق أصغر وكانت التسميات غير متسقة ، أقوم فقط بتحديد مكان الشخصين اللذين يختلفان مع بعضهما البعض ، وقم بالتكبير والتحدث إليهما لمحاولة التوصل إلى حل.

أود أن ألفت انتباهنا الآن للحديث عن أفكارك حول صناعة الذكاء الاصطناعي العامة. الخوارزمية هي النشرة الإخبارية للذكاء الاصطناعي ، وقد منحت قراءنا فرصة لإرسال بعض الأسئلة إليك مسبقًا. يسأل أحد القراء: يبدو أن تطوير الذكاء الاصطناعي قد تفرع بشكل أساسي نحو البحث الأكاديمي أو برامج الشركات الكبيرة ، واسعة النطاق ، كثيفة الاستخدام للموارد مثل OpenAI و DeepMind. حقًا ، هذا لا يترك مجالًا كبيرًا للشركات الصغيرة للمساهمة. ما رأيك في بعض القضايا العملية التي يمكن للشركات الصغيرة التركيز عليها للمساعدة في دفع تبني الأعمال الحقيقية للذكاء الاصطناعي؟

أعتقد أن الكثير من اهتمام وسائل الإعلام يتركز على الشركات الكبيرة وفي بعض الأحيان المؤسسات الأكاديمية الكبيرة. ولكن إذا ذهبت إلى مؤتمرات أكاديمية ، فهناك الكثير من العمل الذي تقوم به مجموعات بحثية صغيرة ومختبرات بحثية. وعندما أتحدث إلى أشخاص مختلفين في شركات وصناعات مختلفة ، أشعر أن هناك الكثير من تطبيقات الأعمال التي يمكن أن تستخدم الذكاء الاصطناعي. عادةً ما أذهب إلى قادة الأعمال وأسأل نفسي ، “ما هي أكبر مشكلاتك التجارية؟ ما هي أكبر مخاوفك؟” لذلك يمكنني فهم أهداف العمل بشكل أفضل ثم تبادل الأفكار حول ما إذا كان لدي حل للذكاء الاصطناعي أم لا. وأحيانًا لا يحدث ذلك ، ولا بأس بذلك.

ربما سأذكر فقط بضع فجوات أجدها مثيرة. أعتقد أن بناء أنظمة الذكاء الاصطناعي اليوم لا يزال يدويًا للغاية. لديك بعض مهندسي التعلم الآلي وعلماء البيانات العظماء الذين يقومون بأشياء على الكمبيوتر ثم يأخذون الأشياء في الإنتاج هناك العديد من الخطوات اليدوية في هذه العملية. لذلك أنا متحمس لعمليات ML [machine learning operations] كنظام ناشئ للمساعدة في جعل عملية بناء ونشر أنظمة الذكاء الاصطناعي أكثر منهجية.

أيضًا ، إذا نظرت إلى العديد من مشكلات العمل النموذجية (جميع الوظائف ، من التسويق إلى المواهب) ، فهناك مجال كبير للأتمتة وتحسين الكفاءة.

آمل أيضًا أن يتمكن مجتمع الذكاء الاصطناعي من دراسة أكبر المشاكل الاجتماعية: رؤية ما يمكننا فعله لتغير المناخ أو التشرد أو الفقر. بالإضافة إلى مشاكل العمل ذات القيمة العالية في بعض الأحيان ، يجب أن نعمل أيضًا على حل المشكلات الاجتماعية الأكبر.

كيف تتم عملية تحديد ما إذا كانت هناك فرصة لمتابعة شيء ما باستخدام التعلم الآلي لعملك؟

سأحاول أن أتعلم القليل عن الأعمال بنفسي وأحاول مساعدة قادة الأعمال على تعلم القليل عن الذكاء الاصطناعي. ثم نقوم عادةً بعصف ذهني لمجموعة من المشاريع ، وسأبذل ، لكل فكرة ، الاجتهاد التقني والتجاري. سنرى: هل لديك بيانات كافية؟ ما هي الدقة؟ هل هناك طابور طويل عند النشر للإنتاج؟ كيف يمكنك ملء البيانات وإغلاق حلقة التعلم مدى الحياة؟ لذلك ، تأكد من أن المشكلة ممكنة تقنيًا. ثم الاجتهاد التجاري: نتأكد من تحقيق عائد الاستثمار الذي نتوقعه. بعد هذه العملية ، لديك الوضع الطبيعي ، وكيفية تقدير الموارد ، والمعالم ، ثم الانتظار حتى يتم تشغيلها.

اقتراح آخر: من المهم أن تبدأ بسرعة ولا بأس أن تبدأ صغيرًا. كان أول تطبيق عملي مهم لي على Google هو التعرف على الصوت ، وليس بحث الويب أو الإعلان. ولكن من خلال مساعدة فريق الكلام في Google على جعل التعرف على الصوت أكثر دقة ، فقد منح هذا فريق Brain المصداقية والموارد اللازمة لتحقيق شراكات متنامية باستمرار. لذلك ، كانت خرائط Google هي الرابط الرئيسي الثاني الذي استخدمنا فيه رؤية الكمبيوتر ، لقراءة أرقام المنازل لتحديد الموقع الجغرافي للمنازل على خرائط Google. وفقط بعد هذين المشروعين الناجحين ، أجريت محادثة أكثر جدية مع فريق الإعلان. لذلك أعتقد أن هناك المزيد من الشركات التي تفشل في البدء أكبر من أن تفشل في البدء صغيرة جدًا. لا بأس في أن تبدأ مشروعًا أصغر كمنظمة لتتعلم كيف تشعر عند استخدام الذكاء الاصطناعي ومن ثم تحقيق نجاح أكبر.

ما الذي يجب أن يبدأ جمهورنا في فعله غدًا لتطبيق الذكاء الاصطناعي في شركاتهم؟

القفز. يُحدث الذكاء الاصطناعي تغييرًا في ديناميكيات العديد من الصناعات. لذا ، إذا لم تعد شركتك تقوم باستثمارات قوية وذكية ، فهذا هو الوقت المناسب.

Add a Comment

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *