هناك صورة منتشرة بقوة على الإنترنت لأم وأب مع ابنتيهم الصغيرتين، وهى صورة تم تحميلها على موقع مشاركة الصور Flickr فى عام 2013، وتضم مجموعة من الوجوه المختلفة فى المواقف المختلفة، لذلك فهى مفيدة فى تدريب أنظمة التعرف على الوجه، التى تستخدم الذكاء الاصطناعى لتحديد الأشخاص فى الصور ومقاطع الفيديو.
وكانت تلك الصورة من بين مليون صورة استعانت بها شركة IBM لمشروع جديد يهدف إلى مساعدة الباحثين على دراسة النزاهة والدقة فى التعرف على الوجه، والذى يطلق عليه Diversity in Faces.
ولكن المرأة التى التقطت الصورة، وهى جيسامين ويست، فوجئت من استخدم الصورة التى التقطتها على هذا النحو، وعبرت عن غضبها الشديد عندما اكتشفت أن شركة آى بى إم تستخدم الصورة لتدريب التقنية الحديثة.
ووفقا لموقع CNN الأمريكى، حملت “ويست” الصورة على موقع Flickr بترخيص إبداعى يسمح للآخرين باستخدام الصورة، ولكن عدم معرفة أن هذه الصورة، إلى جانب صور أخرى تم تضمينها فى مجموعة بيانات للتعرف على الوجه كان أمر مثير للغضب بالنسبة لها.
ومنذ سنوات، لجأ الباحثون إلى الإنترنت لجمع الصور لجميع أنواع الأشياء – بما فى ذلك العديد من الوجوه – على أمل جعل أجهزة الكمبيوتر تفهم العالم من حولهم بشكل أفضل.
وهذا يعنى أن فى كثير من الأحيان يتم استخدام الصور المرخصة فى فليكر ، وسحب الصور من بحث صور جوجل ، والتوصل إليها من حسابات Instagram العامة أو طرق أخرى (بعضها شرعى ، وبعضها ربما لا).
وتهدف مجموعات البيانات الناتجة عادةً إلى العمل الأكاديمي، مثل التدريب أو اختبار خوارزمية التعرف على الوجه، لكن التعرف على الوجه بشكل متزايد ينتقل من المختبرات إلى مجال الشركات الكبيرة، مثلMicrosoft و Amazon و Facebook و Google التى ترى أن مستقبلها فى الذكاء الاصطناعي.
وبما أن المستهلكين يدركون بشكل متزايد قوة البيانات التى يتركونها مثل فتات الخبز عبر الإنترنت، فإن مجموعات بيانات التعرف على الوجه أصبحت نقطة مثيرة للقلق بشأن الخصوصية ومستقبل قد تكون فيه المراقبة أكثر شيوعًا.