أحد صفحات التقدم العلمي للنشر
بياناتذكاء اصطناعي

مشكلة البيانات المُعطِّلة للذكاء الاصطناعي

قد تفشل جهود الذكاء الاصطناعي في الخروج من المختبر إذا لم تدرِ المؤسسات الوصول إلى البيانات بعناية طوال دورة التطوير والإنتاج.

كان مستشفى أمريكي شمالي كبير متحمساً إزاء احتمالات إنشاء نظام ممكَّن بالذكاء الاصطناعي Artificial intelligence (اختصارا: الذكاء AI) لتحسين رعاية المرضى. وبينما كان يخطط للانتقال من المفهوم Concept إلى بناء نموذج أولي Prototypes، اكتشف أن البيانات المطلوبة لبناء النظام وتشغيله كانت مبعثرة في 20 نظاماً قديماً، وأن استرجاع تلك البيانات سيكون معقداً جدا. وكان لابد من إلغاء المشروع.

تعِد التحليلات المتقدمة Advanced analytics والذكاء الاصطناعي بتوليد تبصرات ستساعد المؤسسات على الحفاظ على تنافسيتها. وتعتمد قدرتها على العمل بذلك كثيراً على توفر البيانات الجيدة لكن المؤسسات أحياناً لا تملك البيانات الضرورية لنجاح الذكاء الاصطناعي.

وأخيراً درسنا كيف تنقل المؤسسات مبادراتها الخاصة بالذكاء الاصطناعي من أطر البحث والتطوير R&D إلى الإنتاج والمشكلات التي تواجهها خلال العمل بذلك. ويستند البحث إلى مقابلات مع كبار قادة الذكاء الاصطناعي وموظفين في ست شركات من أمريكا الشمالية مختلفة الأحجام وتعمل في صناعات مختلفة. ومن بين النتائج الرئيسية التي توصل إليها هذا البحث هو أن درجة الوصول إلى البيانات من قِبل الآلات، أحد أبعاد جودة البيانات، لا تزال تمثل تحدياً أكبر أمام إخراج الذكاء الاصطناعي من المختبر وإدخاله في الأعمال، على الرغم من تركيز العديد من الموظفين على دقة البيانات واكتمالها لتحديد جودتها (انظر: ”ما هي البيانات الجيدة؟“ ص 48). والأمر الأكثر أهمية هو أننا وجدنا أن إمكانية الوصول إلى البيانات كثيراً ما تُعامَل في شكل حصري باعتبارها مشكلة من مشكلات تكنولوجيا المعلومات. وفي الواقع، يكشف تحليلنا عن أنها مشكلة إدارية تتفاقم بسبب المفاهيم غير الصحيحة حول طبيعة إمكانية الوصول إلى البيانات ودورها في مجال الذكاء الاصطناعي.

التحليلات المتقدمة

ولا تتعلق إمكانية الوصول إلى البيانات بخصائص البيانات نفسها؛ بل بوجود العناصر المطلوبة لكي تتمكن الآلات من الحصول على البيانات. وعلى الرغم من أن المؤسسات مغمورة بالبيانات، لا يزال الوصول إليها يشكل تحدياً يتفاقم في سياق تطوير الذكاء الاصطناعي وعملياته لسببين مترابطين. أولاً، تتضمن برامج الذكاء الاصطناعي عادةً مجموعات متنوعة من أصحاب المصلحة ذات الاهتمامات المتباينة فيما يتعلق بإمكانية الوصول إلى البيانات. ثانياً، تميل دورة حياة تطوير الذكاء الاصطناعي النموذجية إلى تقويض أهمية إمكانية الوصول إلى البيانات.

تختلف أصحاب المصلحة بالذكاء الاصطناعي حول إمكانية الوصول إلى البيانات

في صميم معظم مسائل إمكانية الوصول إلى البيانات، تتمثل حقيقة أن مبادرات الذكاء الاصطناعي تشمل مجموعات مختلفة إلى حد كبير من الأطراف الفاعلة التي تختلف اهتماماتها ووجهات نظرها وأثرها في طبيعة إمكانية الوصول إلى البيانات ودورها. مثلاً، يشارك قادة الأعمال عادةً في بداية العملية ونهايتها، مما يساعد على تحديد حالات استخدام الذكاء الاصطناعي والاستفادة من المنتج النهائي، لكنهم لا يميلون إلى التفكير في كيفية الوصول إلى البيانات. فقد قال نائب الرئيس لإنجاز المنتجات في شركة استشارية بمجال الذكاء الاصطناعي: ”تعتقد الشركات دائماً بأنها تمتلك البيانات التي تحتاج إليها للذكاء الاصطناعي“. وأشار قائلاً وهو يضحك: ”يريدون أن يبدؤوا بسرعة ثم تبدأ المشكلات. لدينا ملفات PDF، ولدينا جداول بيانات Excel، ومن ثم نحتاج إلى أن نجمع كل ذلك و (نطبق فقط التعرف البصري Optical character recognition على الأحرف) ومعالجته. وليس الأمر سهلاً على الإطلاق“.

من جهة أخرى، يركز علماء البيانات الذين يطوّرون النماذج ويختبرونها ويحافظون عليها، والمستشارون العلميون الذين قد يعملون معهم، في المقام الأول على الحصول على البيانات المطلوبة لتطوير النماذج. وكما هي الحال مع أصحاب المصلحة في الشركات، يكون اهتمامهم بإمكانية الوصول إلى البيانات ضئيلاً جدا.

والواقع أن مهندسي البيانات الذين يبنون البنية التحتية المطلوبة لتوليد البيانات المستخدمة في نماذج علماء البيانات، يهتمون باعتدال بإمكانية الوصول إلى البيانات. ولكنهم يفترضون عادة، بشكل غير صحيح في بعض الأحيان، أن البيانات المستخرجة من الأنظمة التشغيلية لتطوير النماذج الأولية يمكن الوصول إليها بسهولة من أجل استخدام الإنتاج أيضاً.

غير أن إمكانية الوصول إلى البيانات هي مشكلة أكبر بالنسبة إلى مهندسي البرمجيات Software engineers، والذين يتحملون مسؤولية إضافة أدوات الذكاء الاصطناعي في منتج أو خدمة يجب أن يتمكنوا من استخدام البيانات في بيئة إنتاجية. وعلى الرغم من أن الأعضاء في وظيفة تكنولوجيا المعلومات نادراً ما يُعتبَرون أطرافاً فاعلة رئيسية في مبادرات الذكاء الاصطناعي، إلا أنهم يدعمون البنية التحتية التكنولوجية التي يتطلبها الذكاء الاصطناعي (بما في ذلك البيانات). ويساعد عملهم على فرض الامتثال لسياسات الأمن Security policies وآليات الحوكمة Governance mechanisms التي تحمي الأصول التكنولوجية وأصول البيانات.

ولكل من أصحاب المصلحة هذه دور مهم يؤديه. وفي الوقت نفسه، تقتصر رؤيتها لإمكانية الوصول إلى البيانات على مسؤولياتها المباشرة. مثلاً، أخبرنا مسؤول الذكاء الاصطناعي في مؤسسة مالية كبيرة بأن فريقه يحتاج إلى الحصول على كميات كبيرة من البيانات من الأنظمة التشغيلية. ومع ذلك، تعمل العديد من هذه الأنظمة على الحواسيب الرئيسية Mainframes ولم تُصمَّم لدعم متطلبات الوصول إلى البيانات هذه مع دعم العمليات العادية في الوقت نفسه. وعندما يسمع موظفو تكنولوجيا المعلومات الذين تقع عليهم مسؤولية الحفاظ على استمرارية عمل هذه الأنظمة التشغيلية، متطلبات الوصول إلى البيانات الخاصة بمشروعاته المتعلقة بالذكاء الاصطناعي، يكونون أقل استجابة. وفي إحدى الحالات، قال لنا إن إجابتهم هي: ”لا نريد أن يأتي المهووسون المتخرجون حديثاً لكي يسحبوا 15 تيرابايت في اليوم، لأن كل شيء سينهار“.

تقوض دورة حياة الذكاء الاصطناعي إمكانية الوصول إلى البيانات

إضافة إلى مسألة تنوع الأطراف المعنية، تدفع الدورةُ الحياةَ النموذجيةَ لمبادرات الذكاء الاصطناعي الفرق إلى التركيز على التطوير السريع والمتكرر للنماذج. ويؤدي هذا إلى تأخير النقاشات المهمة حول إمكانية الوصول إلى البيانات، ولاسيما المحادثات المتعلقة بالتطبيق الفعلي للذكاء الاصطناعي داخل المؤسسة. وأثناء هذه العملية تتحول طبيعة إمكانية الوصول إلى البيانات من كونها منفصلة عن هياكل إدارة البيانات، وآلياتها، وبنيتها التحتية التكنولوجية إلى متصلة بها. وتتغير مشاركة أصحاب المصلحة الرئيسية بين مراحل تطوير الذكاء الاصطناعي مع انتقال الذكاء الاصطناعي من مجرد فكرة إلى منتج أو خدمة فعلية قيد الاستخدام في المؤسسة. (انظر: أصحاب المصلحة والبيانات في دورة حياة الذكاء الاصطناعي). ولكي نفهم السبب وراء إغفال إمكانية الوصول إلى البيانات في كثير من الأحيان، يتعين علينا أن ندرس كل مرحلة من المراحل الخمس لدورة حياة الذكاء الاصطناعي النموذجية التي لاحظناها في كل المؤسسات الست التي درسناها.

ما هي البيانات الجيدة؟ في كل المبادرات التي درسناها، وكذلك في محادثات منفصلة مع خبراء آخرين في الذكاء الاصطناعي، ارتبط السؤال حول البيانات العالية الجودة بمفهوم البيانات المناسبة للاستخدام من قبل المستهلكين.1R.Y. Wang and D.M. Strong, “Beyond Accuracy:
What Data Quality Means to Data Consumers,” Journal of Management Information Systems 12, no. 4 (spring 1996): 5-33; L.L. Pipino, Y.W. Lee, and R.Y. Wang, “Data Quality Assessment,” Communications of the ACM 45, no. 4 (April 2002): 211-218; and B. Baesens, R. Bapna, J.R. Marsden, et al., “Transformational Issues of Big Data and Analytics in Networked Business,” MIS Quarterly 40, no. 4 (December 2016): 807-818.
وفي الذكاء الاصطناعي، تكون الآلات لا البشر المستهلكين الرئيسيين للبيانات. فهي تعالج البيانات لتوليد تبصرات سيستخدمها البشر (مثل محلل أو رجل أعمال) أو آلة أخرى. وتشمل جودة البيانات أربعة أبعاد: البعد الأساسي (الدقة) والبعد السياقي (الاكتمال) والبعد التمثيلي (القابلية للتفسير) وبعد إمكانية الوصول (التوفر أو الاستعادة السهلة والسريعة). ولكي تُعتبَر البيانات ذات جودة عالية، يجب أن تلبي الأبعاد الأربعة.

التحليلات المتقدمة

المرحلة 1: توليد الأفكار Ideation. تعمل مرحلة توليد الأفكار كمرشح (فلتر) لتحديد حالات الأعمال العالية المستوى High-level business cases المحتملة للذكاء الاصطناعي في المؤسسة. وتدور أغلب المحادثات أثناء هذه المرحلة بين المديرين، ومستشاري الأعمال، والمستشارين العلميين (الذين يعملون في بعض الأحيان كأكاديميين بدوام كامل). والهدف من ذلك هو إنشاء مساحة لالتقاء الأعمال بالعلوم. ولا بد أن تبدو حالات الأعمال الناجمة عن ذلك واعدة وممكنة. وفي الشركات الاستشارية في مجال الذكاء الاصطناعي تبنى هذه الخطوة الأولى الحاسمة بتثقيف العملاء حول إمكانيات الذكاء الاصطناعي. ولكن خلال هذه المرحلة يكون التركيز على وجود البيانات بدلاً من إمكانية الوصول إلى البيانات. وتدور المناقشات حول أهداف الأعمال وتطبيق نماذج الذكاء الاصطناعي لمعالجة مشكلات المؤسسة الحالية.

المرحلة 2: المخطط Blueprint. لن يجري اختيار حالات الاستخدام كلها التي طُرحت أثناء مرحلة توليد الأفكار لتنفيذها خلال فترة معينة بسبب الأولويات أو القيود الخاصة بالموارد أو غياب القيمة المحتملة. فخلال مرحلة المخطط، تُعد حالة استخدام شاملة Comprehensive use case. ويشمل ذلك تفاصيل مثل أهداف واضحة وقابلة للقياس للأعمال، وخطة عمل تحدد تقنيات الذكاء الاصطناعي المحددة، وعناصر البيانات التي يجب أن تكون متاحة لتغذية الذكاء الاصطناعي. فخلال مرحلة المخطط، لا تزال إمكانية الوصول إلى البيانات تُقيَّم فقط وفق وجود البيانات، لأن المشاهِد Sights تُحدَّد في المرحلة التالية من العملية، وهي بناء نموذج أولي عملي. والافتراض الأساسي هنا هو أن توفر البيانات توفرا جيدا بالقدر الكافي، لأنه يسمح للفريق بالتحرك إلى الأمام.

المرحلة 3: إثبات المفهوم Proof of concept. أثناء مرحلة إثبات المفهوم، يبني علماء البيانات نموذجين أو أكثر لتنفيذ حالات الاستخدام المتفق عليها. ويركز معظم العمل على الإنشاء والتدريب واختبار النماذج على نحو متكرر لقياس الأداء النسبي للحالات ومقارنتها بعضها ببعض ولمعرفة ما إذا كان الذكاء الاصطناعي يحقق التوقعات بالفعل عند تغذيته بمدخلات Input جديدة. وتُستخرَج البيانات من أنظمة المصادر Source systems وتُحوَّل من قبل مهندسي البيانات لكي تتوافق مع متطلبات التنسيق والدقة الخاصة بالنماذج قيد الإنشاء. وعلى الرغم من أن الحل في نهاية المطاف قد يُقدَّم على شكل تطبيق Application ذي واجهة مستخدم User interface أو يُدمَج في شكل محكم ضمن الإجراءات (لتغيير عملية طلب الائتمان في مصرف، مثلاً)، لا تركز مرحلة إثبات المفهوم عادة على هذه الجهود بعد. وعلى نحو مماثل، تركز الفرق على الحصول على البيانات اللازمة لتعزيز عملها في الأجل القريب، الأمر الذي لا يعطي كثيراً من الاعتبار لكيفية الوصول إلى البيانات في نهاية المطاف بمجرد دخول الذكاء الاصطناعي في مرحلة الإنتاج.

المرحلة 4: منتج فاعل بالحد الأدنى Minimum viable product (اختصارا: المنتج (MVP بمجرد أن يُظهر أحد أشكال إثبات المفهوم قيمة كافية، يُنقَّح ليكون منتجا فاعلا بالحد الأدنى. وعند هذه النقطة، يتقهقر علماء البيانات ومهندسو البيانات ويتسلم مهندسو البرمجيات السلطة، لأن الذكاء الاصطناعي سيغادر المختبر في نهاية المطاف، ويطبق داخل البنية التحتية للمؤسسة، ويندمج في أنظمة الإنتاج الأخرى، إذا كان ذلك قابلاً للتطبيق. ومن النتائج غير المقصودة للتركيز القوي على تطوير النماذج في المراحل السابقة أن الاعتبارات المتعلقة بإمكانية الحصول على البيانات في الإنتاج لم تعد أولوية. وبمجرد أن يكون مهندسو البرمجيات وموظفو تكنولوجيا المعلومات أكثر مشاركة في المناقشات حول المواصفات ودمج الحل المطلوب إنجازه، فإن الأسئلة المثارة حول إمكانية الوصول إلى البيانات قد تكشف عن أن الميزة الحاسمة التي يستخدمها النموذج تتطلب عملاً كبيراً غير مخطط له.

المرحلة 5: الإنتاج Production. في هذه المرحلة الأخيرة، يُطلَق المنتج الفاعل بالحد الأدنى MVP الذي يحتوي على الذكاء الاصطناعي في مرحلة الإنتاج ويجب الآن تغذيته بالبيانات التي يجري الحصول عليها مباشرة من أنظمة الإنتاج. فقد تحتاج البيانات إلى سحبها من أنظمة متعددة وتحويلها لتوليد المدخلات المطلوبة للنموذج لدعم حالة العمل في الإنتاج. وسواء حدث هذا في الوقت الفعلي أم على دفعات (مثلاً، لإعادة تدريب نموذج وإعادة اختباره على فترات متكررة)، فإن هذا هو المكان الذي تنشأ فيه المسائل الحقيقية المرتبطة بدمج الذكاء الاصطناعي، ولاسيما فيما يتصل بالبنية التحتية للبيانات في المؤسسة. وإذا تعذر توفير البيانات واستخراجها ودمجها بواسطة أنظمة ذات استقلالية بالحجم المطلوب أو السرعة المطلوبة (بسبب الأنظمة القديمة، مثلاً)، فقد يفقد الذكاء الاصطناعي كل قيمته المحتملة.

أربعة مفاهيم غير صحيحة حول إمكانية الوصول إلى البيانات الضرورية للذكاء الاصطناعي

إضافة إلى فهم الأدوار والمراحل المختلفة لتطوير الذكاء الاصطناعي وأثرها في إمكانية الوصول إلى البيانات، من المفيد فهم بعض المفاهيم غير الصحيحة الأساسية حول طبيعة البيانات وكيفية فهمها في العديد من المؤسسات.

المفهوم غير الصحيح الرقم 1. إمكانية الوصول إلى البيانات هي مسألة تقنية Data accessibility is a technical issue.

على الرغم من أن مشكلات التكنولوجيا كثيراً ما تكون معقدة، إلا أنها عادة ما يمكن إصلاحها بالمواهب والموارد المناسبة. وجادل مشاركون في بحثنا بأن إمكانية الوصول إلى البيانات هي في الواقع مسألة إدارية تتضمن التكنولوجيا. ويجب أن تبدأ حلول الذكاء الاصطناعي بفهم واضح لأن البيانات الكاملة والدقيقة والمتوفرة في الوقت المناسب لا قيمة لها إذا تعذر استردادها بسرعة وسهولة. وحقيقة أن البيانات توجد في مكان ما عبر العديد من قواعد البيانات وجداول البيانات لا تعني بالضرورة أنها يمكن الوصول إليها. وفي بعض الأحيان، توجد مشكلات تتعلق بإمكانية الوصول إلى البيانات لأن سياسات حوكمة البيانات أو أمانها تقيد الوصول إليها.

إن إمكانية الوصول إلى البيانات هي في الواقع مسألة إدارية تتضمن التكنولوجيا. يجب أن تبدأ حلول الذكاء الاصطناعي بفهم واضح؛ لأن البيانات الكاملة والدقيقة والمتوفرة في الوقت المناسب لا قيمة لها إذا تعذر استردادها بسرعة وسهولة.

وظلت الأولويات المتنافسة بين العاملين في مجال تكنولوجيا المعلومات والأعمال قائمة لعقود من الزمن. وعندما تضيفون أولويات فرق الذكاء الاصطناعي إلى المزيج، سرعان ما تشيع الفوضى. وإذا جرى التعامل مع إمكانية الوصول إلى البيانات على أنها مشكلة تقنية فقط، فقد تظل منتجات الذكاء الاصطناعي وخدماته عالقة في مرحلة إثبات المفهوم إلى أن يجري التصدي لتحديات إمكانية الوصول إلى البيانات من قِبل فرق أخرى، الأمر الذي يؤدي إلى المزيد من التأخير وتكبد تكاليف إضافية. أو ربما لا ترقى منتجات الذكاء الاصطناعي إلى مستوى إمكاناتها الكاملة بسبب البيانات المفقودة التي لم تُسترَد لأنها إما معقدة جدا أو مكلفة جدا. وفي كلتا الحالتين سيفشل الذكاء الاصطناعي في الوفاء بوعوده، ليس بسبب نماذج الذكاء الاصطناعي بل بسبب القدرة على الوصول إلى البيانات.

المفهوم غير الصحيح الرقم 2. البيانات ليست سوى نتاج ثانوي للعمليات Data is merely a byproduct of operations. في الأغلب يظهر هذا المفهوم غير الصحيح في المؤسسات التي تكون فيها جهود التحليل والذكاء الاصطناعي مختلفة عن العمليات، وحيث لم يجرِ بعد التعرف على إمكانية الذكاء الاصطناعي لتحسين العمليات أو إحداث ثورة في المؤسسة. ونتيجة لذلك، تستهلك الأنظمة التشغيلية (مثل التخطيط لموارد المؤسسات وإدارة علاقات العملاء) البيانات وتنتجها، لكن لا يوجد فهم للقيمة المحتملة لهذه البيانات بالنسبة إلى الذكاء الاصطناعي. وإذا كانت فرق التحليلات والذكاء الاصطناعي تريد استخدام البيانات من العمليات، فعليها استردادها والاستفادة منها بمفردها، على غرار ما فعلته فرق مستودع البيانات التقليدي لسنوات عديدة.2R. Kimball and M. Ross, “The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling,” 3rd ed. (Indianapolis: John Wiley & Sons, 2013).

وحيثما يسود هذا المفهوم غير الصحيح، يمكن أن تكون البيانات وفيرة داخل المؤسسة لكن الذكاء الاصطناعي لا يستخدمها. ويحدث هذا عادةً لأن الآثار الرقمية لعمليات الأعمال تكون في الأغلب مجزأة عبر الأنظمة التشغيلية، مما يجعل من الصعب استرداد البيانات المطلوبة لإعادة إنشاء صورة متسقة لتلك العمليات. وباختصار، لا تُستغَل الإمكانات الاستراتيجية للبيانات كمدخلات لتوليد القيمة بالقدر الكافي.

المفهوم غير الصحيح الرقم 3. يمكن معالجة إمكانية الوصول إلى البيانات في المراحل اللاحقة من دورة حياة الذكاء الاصطناعي Data accessibility can be addressed in the later phases of the AI life cycle. صُمِّمت المراحل الخمس لدورة حياة الذكاء الاصطناعي لدفع فرق الذكاء الاصطناعي إلى العمل بطريقة رشيقة Agile mode، ولاسيما أثناء مرحلتي إثبات المفهوم والمنتج الفاعل بالحد الأدنى MVP. وطبيعة الذكاء الاصطناعي نفسها باعتباره مسعى غير مؤكد تقدم مساعدة كبيرة لهذا النهج. ولابد أن تكون الفرق قادرة على تجربة النماذج والتمحور حول النتائج الناشئة من أجل إيجاد الحل الأمثل لمشكلة المؤسسة. ومن المؤسف أن هذا يشجع أيضاً الفرق على التركيز تركيزا شبه كامل على الجزء العلمي من عمل الذكاء الاصطناعي بما يفيد المراحل الثلاث الأولى. وأصحاب المصلحة المشاركين في مراحل توليد الأفكار المخطط وإثبات المفهوم ليسوا هم الذين يتعاملون مع مسائل الوصول إلى البيانات. ويهتم مهندسو البيانات أساسا بإنشاء ملفات مسطحة يمكن أن يستخدمها علماء البيانات لإنشاء نماذج وتدريبها، ولا يتورعون عن اللجوء إلى أي وسيلة في متناولهم لإنشاء تلك الملفات – بما في ذلك الحيل والحلول البديلة والبيانات التي جرت محاكاتها.

ولكي يضيف النظام الممكّن بالذكاء الاصطناعي قيمة ضمن إطار المؤسسة، فلا بد من تجميعه كمنتج أو خدمة يمكن دمجها في البنية التحتية للمؤسسة. وفي كثير من الأحيان، لا تعالج مخاوف التكامل إلاّ في وقت متأخر من دورة الحياة. (انظر: أصحاب المصلحة والبيانات في دورة حياة الذكاء الاصطناعي). ومن ثم يكون مهندسو البرمجيات والعاملين في تكنولوجيا المعلومات حاملين لأخبار سيئة. وعندما لا تتعامل الشركات مع إمكانية الوصول إلى البيانات في وقت مبكر، ينتهي بها الأمر في الأغلب إلى تكبد تكاليف إضافية غير متوقعة. وإضافة إلى ذلك، يمكن أن تتوقف المشروعات في حين أن أولويات أصحاب المصلحة الأخرى (عادة موظفي تكنولوجيا المعلومات) تُعدَّل في شكل غير متوقع لمعالجة مسائل إمكانية الوصول إلى البيانات. وفي بعض الحالات، قد تفشل مبادرات الذكاء الاصطناعي في تطبيقه بالإنتاج.

لقد صارت الشركات تتمتع بمهارات عالية في بناء إثباتات مفاهيم ممكَّنة بالذكاء الاصطناعي. ومع ذلك، فإن الاختبار الحقيقي هو ما إذا كان بإمكانها تجاوز بيئات المختبر الخاضعة للتحكم والخاصة بإثبات المفهوم إلى العمل في بيئات الإنتاج الفوضوية.

المفهوم غير الصحيح الرقم 4. البيانات الموجودة في المختبر والبيانات الموجودة في العمليات متماثلة Data in the lab and data in operations are the same. فقد صارت الشركات تتمتع بمهارات عالية في بناء إثباتات لمفاهيم ممكَّنة بالذكاء الاصطناعي. ومع ذلك، فإن الاختبار الحقيقي هو ما إذا كان بإمكانها تجاوز بيئات المختبر الخاضعة للتحكم والخاصة بإثبات المفهوم إلى بيئات الإنتاج الفوضوية. وفي الأغلب يكون الافتراض هو أن عملية استرجاع البيانات لمرحلة إثبات المفهوم يمكن تكرارها بتكلفة قليلة أو من دون تكلفة بمجرد انتقال الذكاء الاصطناعي إلى أن تكون المنتج الفاعل بالحد الأدنى MVP ثم إلى الإنتاج. ولكن تذكروا أن البيانات الواردة في دليل المفاهيم تأتي من بعض ملفات البيانات المسطحة التي أُنشِئت على وجه التحديد، في الأغلب من لقطات تاريخية للبيانات، بغرض إنشاء نماذج الاختبار والتطوير.

وفي مرحلة الإنتاج يجب أن يكون الذكاء الاصطناعي متصلاً بأنظمة حية متعددة تسترد المدخلات اللازمة لأداء عمله، في الوقت الفعلي أحياناً. وقد تكون ميزات البيانات التي يجب استخراجها متماثلة، لكن الطريقة التي يجري بها الوصول إلى البيانات واستردادها مختلفة جدا. مثلاً، قد تختلف متطلبات حجم البيانات وسرعتها بالنسبة إلى العمليات اختلافاً كبيراً عما هو مطلوب لإعادة تدريب النماذج. في الواقع، تقتصر صلاحيات الأعمال الاستشارية في مجال الذكاء الاصطناعي التي درسناها عن عمد على تطوير إثباتات مفاهيم لتجنب مسألة البيانات في الإنتاج تماماً.

وعندما تفترض المؤسسات أن البيانات الموجودة في المختبر والبيانات التي تُنتَج هي البيانات نفسها، فإنها تُخفي جزءاً كبيراً من تعقيد إمكانية الوصول إلى البيانات. وهذا يعني أن مبادرات الذكاء الاصطناعي قد تكون سريعة في البدء لكنها تستغرق وقتاً طويلاً وغير مخطط له وتتطلب جهوداً مكثفة لتكون قابلة للتطبيق في الإنتاج.

كيفية إدارة إمكانية الوصول إلى البيانات من أجل الذكاء الاصطناعي

قد تؤثر مشكلات إمكانية الوصول إلى البيانات في نجاح الذكاء الاصطناعي في المؤسسة. وللتخفيف من هذه الحالات، فإننا نقدم ثلاث توصيات لتحسين إدارة إمكانية الوصول إلى البيانات من أجل الذكاء الاصطناعي: طوّر فهم أصحاب المصلحة لإمكانية الوصول إلى البيانات للنظر إليه كمسألة تخص الأعمال، واعترف بقيمة البيانات المؤسسية للذكاء الاصطناعي، والفكِّر في إمكانية الوصول إلى البيانات على مدار دورة حياة الذكاء الاصطناعي.

عزز إمكانية الوصول إلى البيانات كمسألة تتعلق بالأعمال أولاً ثم كمسألة تكنولوجية في المرتبة الثانية Promote data accessibility as a business issue first and a technology issue second. يجب على أصحاب المصلحة كلها في مبادرات الذكاء الاصطناعي تطوير فهم مشترك لإمكانية الوصول إلى البيانات كجزء لا يتجزأ من جودة البيانات، لا يؤثر في تكنولوجيا المعلومات فحسب، بل أيضاً في العمليات ويتطلب الاهتمام طوال دورة حياة الذكاء الاصطناعي. ويحتاج أصحاب المصلحة إلى عرض معرفتهم بالأدوار حول إمكانية الوصول إلى البيانات من أجل بناء فهم مشترك لها باعتبارها مسألة أعمال.

وقد يستغرق تغيير طريقة تفكرنا في إمكانية الوصول إلى البيانات وقتاً ويتطلب محادثات وقدرا من التعاون لم يحدث من قبل. ففي إحدى المؤسسات الاستشارية في مجال الذكاء الاصطناعي التي درسناها، صارت إمكانية الوصول إلى البيانات جزءاً من المناقشات المبكرة الرفيعة المستوى التي أجراها الموظفون مع عملائهم، وهي مدرجة في مرحلة توليد الأفكار في دورة حياة الذكاء الاصطناعي. وفي حالات أخرى، فقد تضمن المحادثات الجارية بين أصحاب المصلحة تأسيس التوافق بين احتياجات فرق الذكاء الاصطناعي وموارد المؤسسة (مثل موظفي تكنولوجيا المعلومات) والحفاظ على التوافق بمرور الوقت. أما مجرد تأسيس إمكانية الوصول إلى البيانات باعتبارها مسألة مهمة في مجال الأعمال عند المستوى الاستراتيجي؛ فلن يكون كافياً في الأرجح. ويلزم بذل جهد وانتباه متواصلين لتحقيق المطلوب؛ وإلا ستظل مشكلات إمكانية الوصول إلى البيانات مجرد مشكلات في التكنولوجيا، الأمر الذي يؤدي إلى تراكم الأعمال التي يتعين على موظفي تكنولوجيا المعلومات إصلاحها — إن أمكن.

وهذا يعني أيضاً تثقيف أعضاء فريق الذكاء الاصطناعي حول أهمية تحديد المسائل المتعلقة بإمكانية الوصول إلى البيانات وضرورة إثارة هذه المسائل مع الإدارة. وقد يكون الإصلاح التكنولوجي لمسألة الوصول إلى البيانات بسيطاً، لكنه قد يتطلب المرور بإجراءات مُوافَقة مطولة، وقد تحول سياسات الأمن دون الوصول إلى البيانات. ففي هذه الحالات لا يوجد حل تكنولوجي، والحل الوحيد الممكن، إذا كانت حالة العمل التي صِيغَت في مرحلة توليد الأفكار تدعم ذلك، هو المشاركة في مناقشات مفيدة حول تخفيف بعض جوانب سياسة الأمن لدعم عمل فريق الذكاء الاصطناعي.

خذ بعين الاعتبار أي بيانات قد تكون مرشحة محتملة للذكاء الاصطناعي Consider any data as a potential candidate for AI. لا تشكل إمكانية الوصول إلى البيانات أهمية فقط في حالات الأعمال الحالية التي تتعلق بالذكاء الاصطناعي. وتعني التطبيقات المتنوعة للذكاء الاصطناعي في العديد من المشكلات التي تواجهها المؤسسات أن أي بيانات تمتلك بالفعل إمكانية أن تكون مدخلات قيّمة لمبادرة الذكاء الاصطناعي. ومن العناصر الرئيسية لتحسين إمكانية الوصول إلى البيانات في أنحاء المؤسسة كلها تجاوز التصور بأن البيانات هي فقط المنتج الثانوي للعمليات. وبعبارة أخرى، لا يعني وصول بعض البيانات إلى نهاية دورة حياتها المفيدة لتنفيذ عملية معينة أنه لا يمكنها أن تساهم في توليد قيمة كمدخل للذكاء الاصطناعي. وفي أحد أمثلتنا، تعمل الآن سنوات من السجلات التشغيلية التي تُجمَع في شكل روتيني بواسطة أنظمة التدفئة والتهوية وتكييف الهواء كمدخلات لإنشاء نماذج الصيانة الوقائية.

إن رؤيةِ ثقافةٍ توجهها البيانات ويعتمد فيها الموظفون على البيانات لتوجيه قراراتهم تُركِّز في العادة على المنتج النهائي– أي استخدام البيانات المستخرجة – وليس على الإجراءات المطلوبة إيصال هذه البيانات إلى هؤلاء الموظفين. ويجب أن تدرك خطوط الأعمال Business lines أن مخرجات البيانات الخاص بها قد تُغذي إدخال الذكاء الاصطناعي. مثلاً، تُستخدَم سجلات العمل التي ينتجها موظفو خدمة السفر في شكل تقليدي لمراقبة الإنتاجية وضمان تلبيتهم الحصص النسبية لطلبات الخدمات. ولكن إذا كان لدى المؤسسات حق الوصول إلى بيانات تفصيلية بأثر رجعي حول نوع طلبات الخدمة ومدتها، يمكنها استخدام هذه البيانات كمدخلات للذكاء الاصطناعي لتحسين الجدولة وتخصيصها استناداً إلى خبرة الموظفين. وقد يؤثر الوعي في الوظائف بالدور المزدوج للبيانات كناتج (في هذه الحالة، وقت انتهاء الطلب من موظفي خدمة السفر) والمدخلات (مدة طلبات الخدمة التي يستخدمها الذكاء الاصطناعي لتحسين الجدولة) على اختيار حل أو بائع، أو ضبط نظام Configuration of a system.

كانت أكثر حالات الأعمال التي درسناها نجاحاً هي تلك التي بُنِيت فيها العمليات التشغيلية مع فكرة أن أنظمتها الداعمة في نهاية المطاف ستقدم البيانات إلى الذكاء الاصطناعي. وفي إحدى الحالات أخبرنا قائد للذكاء الاصطناعي في مؤسسة مالية كبيرة بأن إعادة هندسة الإجراءات وترقيات النظام Upgrading (مثل الترحيل إلى الخدمات المستندة إلى السحابة Cloud-based services) هي متطلبات مهمة لدعم دمج الذكاء الاصطناعي في عمليات الأعمال الحالية. ومن بين العناصر الحاسمة التي تدعم هذا الإنجاز استخدام آليات الحوكمة التي تجعل من استرداد البيانات والوصول إليها أمراً سهلاً على البشر والآلات.

عالجْ إمكانية الوصول إلى البيانات مند بداية مبادرات الذكاء الاصطناعي Address data accessibility at the onset of AI initiatives. إن تطوير النموذج التكراري في دورات حياة الذكاء الاصطناعي لا يحول دون التفكير في إمكانية الوصول إلى البيانات في مرحلة مبكرة من مبادرات الذكاء الاصطناعي والحصول على الخبرة المناسبة مبكرا منذ البداية. وفي بعض الحالات، كان هذا يعني إدراج مشاركة مهندسي البرمجيات وموظفي تكنولوجيا المعلومات خلال مرحلة التخطيط لكي تكون المعايير الرفيعة المستوى للمنتج أو الخدمة النهائية المضمنة بالذكاء الاصطناعي معروفة على نطاق واسع، و من ثم يمكن إثارة المخاوف حول إمكانية الوصول إلى البيانات. والأمر الأكثر أهمية هو ضمان أن يؤخذ بعين الاعتبار تكامل الذكاء الاصطناعي في المستقبل ضمن البنية الأساسية للمؤسسة، في حين يعمل على الحد من نشوء المفاجآت في وقت لاحق من هذه العملية. وتحقيقاً لهذه الغاية، نشجع المديرين على التمييز بوضوح بين مهمة الحصول على البيانات لبناء الذكاء الاصطناعي ومهمة جعل البيانات متاحة Making data accessible في الإنتاج. وإنه لشيء طيب أن نبني الذكاء الاصطناعي في بيئة مخبرية خاضعة للتحكم، لكن هذا لا يعني أن استخدامه في الإنتاج بالمستقبل لا بد أن يكون مجرداً.

ومن الفوائد الرئيسية لهذا النهج أنه يسمح بأداء جزء من العمل بالتوازي. مثلاً، يمكن تشجيع مهندسي البيانات على الخوض في النقاش مع موظفي تكنولوجيا المعلومات في وقت مبكر لوضع خريطة طريق للبيانات. وبحلول مرحلة المنتج الفاعل بالحد الأدنى MVP من دورة الحياة، سيكون خط هندسة البيانات Data engineering pipelines جاهزا للاتصال بالبنية التحتية للإنتاج. وهناك نمط آخر محتمل يتمثل بالمهام المذهلة المرتبطة بإمكانية الوصول إلى البيانات، وهندسة البيانات Data engineering، وبناء النماذج Model building في العمليات المختلفة، على غرار ما اقتُرِح في المشروعات الكثيفة البيانات.3R. Hughes, “Agile Data Warehousing Project Management: Business Intelligence Systems Using Scrum” (Waltham, Massachusetts: Morgan Kaufmann, 2013); and K. Collier, “Agile Analytics: A Value-Driven Approach to Business Intelligence and Data Warehousing” (Boston: Addison-Wesley, 2011). وهذا يتيح التزامن بين الأنشطة مع تضمين درجة معينة من التأخير التي يمكن أن تسمح بإجراء التعديلات إذا لزم الأمر. وحتى إذا لم تتجاوز مبادرة الذكاء الاصطناعي مرحلة إثبات المفهوم أو مرحلة المنتج الفاعل بالحد الأدنى MVP بعد كل هذه الجهود، سيكون تحسين إمكانية الوصول إلى البيانات على المستوى التنظيمي دائماً مفيداً لمبادرات الذكاء الاصطناعي في المستقبل.

انتشر الرأي القائل إن البيانات تشكل أصلاً رئيسياً Key corporate asset من أصول الشركات على نطاق واسع بين قادة الأعمال، كما كان متوقعاً أن تعمل الأنظمة التي تعمل بالذكاء الاصطناعي والتي تستهلك البيانات على دفع ميزة تنافسية جديدة. ولكن ليس في شكل متكرر، فالشيطان يكمن في تفاصيل التنفيذ. أما عدم فهم أصحاب المصلحة كلها للأبعاد الكاملة لجودة البيانات، وإبعاد مبادرات الذكاء الاصطناعي عن العمليات؛ فيمكن أن يحدَّ من أثر مشروعات الذكاء الاصطناعي أو أن يخرجها عن مسارها تماماً. وتفهم المؤسسات التي تستفيد من أهم فوائد الذكاء الاصطناعي أنها تحتاج إلى تقييم البيانات بقدر ما هي مدخلات وإعطاء إمكانية الوصول إلى البيانات الاهتمام الذي تستحقه لدفعه إلى خارج نطاق البحث والتطوير وإدماجه في عملياتها.

غريغوري فيال Gregory Vial

غريغوري فيال Gregory Vial

أستاذ مساعد لتكنولوجيا المعلومات في إتش إي سي مونتريال HEC Montréal.

جينغلو جيانغ Jinglu Jiang

جينغلو جيانغ Jinglu Jiang

أستاذ مساعد لأنظمة المعلومات الإدارية في جامعة بينغهامتون Binghamton University.

تانيا جيانيليا Tanya Giannelia

تانيا جيانيليا Tanya Giannelia

طالبة دكتوراه في تكنولوجيا المعلومات في HEC Montréal.

آن فرانسيس كاميرون Ann-Frances Cameron

آن فرانسيس كاميرون Ann-Frances Cameron

أستاذة مساعدة لتكنولوجيا المعلومات في HEC Montréal. للتعليق على هذا الموضوع: https://sloanreview.mit.edu/x/62209.

المراجع

المراجع
1 R.Y. Wang and D.M. Strong, “Beyond Accuracy:
What Data Quality Means to Data Consumers,” Journal of Management Information Systems 12, no. 4 (spring 1996): 5-33; L.L. Pipino, Y.W. Lee, and R.Y. Wang, “Data Quality Assessment,” Communications of the ACM 45, no. 4 (April 2002): 211-218; and B. Baesens, R. Bapna, J.R. Marsden, et al., “Transformational Issues of Big Data and Analytics in Networked Business,” MIS Quarterly 40, no. 4 (December 2016): 807-818.
2 R. Kimball and M. Ross, “The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling,” 3rd ed. (Indianapolis: John Wiley & Sons, 2013).
3 R. Hughes, “Agile Data Warehousing Project Management: Business Intelligence Systems Using Scrum” (Waltham, Massachusetts: Morgan Kaufmann, 2013); and K. Collier, “Agile Analytics: A Value-Driven Approach to Business Intelligence and Data Warehousing” (Boston: Addison-Wesley, 2011).
اظهر المزيد

مقالات ذات صلة

زر الذهاب إلى الأعلى