Kualitas Data Membatasi Penerimaan GenAI

Saat kecerdasan buatan generatif (AI gen) melesat ke sorotan publik dengan rilis ChatGPT pada tahun 2022, para pengguna bisnis yang menguasai teknologi dengan cepat mulai bereksperimen. Pada saat itu, alat-alat yang ada terbatas pada sekelompok kasus penggunaan yang cukup terbatas, dan tingkat kepercayaannya rendah. Dengan sedikit aplikasi genAI yang siap pakai, kurangnya pengetahuan merupakan hambatan utama dalam mengejar solusi genAI, terutama untuk kasus bisnis yang lebih spesifik.

Teknologi inti untuk genAI berbasis teks adalah model bahasa besar (LLM). Kompleksitas dan sumber daya yang diperlukan untuk membuat LLM membuatnya sulit dijangkau bagi kebanyakan perusahaan. Saat ini, bisnis yang ingin menerapkan kasus penggunaan genAI memiliki pilihan LLM yang sudah ada untuk digunakan dan disesuaikan. Hambatan untuk masuk sudah menurun ke tingkat yang hampir bisa dijangkau oleh hampir semua tim teknologi yang matang. Bagi perusahaan yang kurang memiliki keterampilan atau ambisi untuk bekerja langsung dengan LLM, platform perangkat lunak di hampir setiap fungsi bisnis sekarang menawarkan fitur genAI siap pakai untuk digunakan sehari-hari, tanpa keterampilan khusus yang dibutuhkan.

Jika tahun 2023 adalah tahun eksperimen genAI, 2024 akan menjadi tahun peluncuran solusi genAI ke produksi untuk melayani pelanggan dan peran yang berhadapan langsung dengan pelanggan. Kemampuan untuk merangkum jumlah data tidak terstruktur yang besar dan menghasilkan konten kreatif (termasuk teks, gambar, dan bahkan video!) menarik bagi petugas pendapatan dan tim eksekutif secara keseluruhan. Survei AI Pulse September 2023 dari Forrester menunjukkan bahwa 70% perusahaan B2B sudah menggunakan genAI dan 20% lagi sedang menjelajahi penggunaannya.

Poin Persamaan Adalah Kualitas Data

Banyak hal bisa terjadi antara permintaan pengguna, interpretasi pertanyaan, bagaimana tanggapan dihasilkan, dan bagaimana tanggapan dikomunikasikan kembali ke pengguna. Terlepas dari jalur teknis apa yang dikejar bisnis Anda, faktor pembatas utama yang akan Anda hadapi saat ini adalah kualitas data Anda sendiri. Pepatah lama “sampah masuk, sampah keluar” bahkan lebih benar untuk genAI. GenAI menempatkan tekanan belum pernah terjadi sebelumnya pada kemampuan Anda untuk tata kelola data karena beberapa alasan:

GenAI mengonsumsi data dengan tingkat kecepatan, skala, dan kompleksitas yang baru. Tim data dan operasi yang mengelola kasus penggunaan bisnis tradisional fokus pada perawatan dan pembersihan kumpulan data yang terdefinisi. GenAI mengonsumsi data terstruktur dan tidak terstruktur dengan cara yang sama, memungkinkan akses untuk generasi wawasan dengan kecepatan dan skala yang belum pernah terjadi sebelumnya, termasuk tipe data yang kebanyakan perusahaan tidak aktif mengelolanya.
GenAI menggunakan data untuk menghasilkan wawasan secara tidak dapat diprediksi. Tim pengukuran dan analitika biasanya mengontrol gerbang di mana pengguna akhir mengajukan pertanyaan data yang tersedia. Wawasan disampaikan melalui laporan dan panel kontrol, dengan masing-masing menawarkan pengalaman yang disusun dengan cakupan yang terbatas. GenAI memberi akses ke repositori data yang luas dan akan membuat lompatan intuitif untuk mendukung pertanyaan pengguna. Tim manajemen data tidak bisa lagi memprediksi data mana yang harus dibersihkan untuk memberikan wawasan yang akurat karena mereka tidak lagi mengendalikan pertanyaan apa yang diajukan.
Keamanan, privasi, dan pernyataan persetujuan memerlukan proses baru yang belum ada saat ini. Mengelola keamanan data dan privasi pada kasus penggunaan bisnis tradisional bergantung pada pengendalian data sumber. Data yang melanggar standar kepatuhan dihapus, dan keamanan data bergantung pada pengendalian akses ke kumpulan data tertentu oleh pengguna yang disetujui. Model genAI tidak bergantung pada pertanyaan aktif data sumber untuk memenuhi permintaan. Setelah data latihan telah diserap, tim data tidak bisa lagi dengan mudah mengontrol pengguna mana yang diizinkan mengakses elemen data mana. Keamanan dan kepatuhan bergantung pada mengetahui tingkat akses yang sesuai untuk setiap pengguna akhir. Dengan tidak adanya standar saat ini yang mengaitkan kembali model genAI ke data sumber mereka, ini menciptakan tingkat ketidakpastian dan risiko baru. Dalam Survei AI Pulse yang disebutkan di atas, kekhawatiran privasi dan keamanan data dilihat sebagai hambatan terbesar untuk adopsi genAI oleh perusahaan B2B.

Tantangan Data Untuk GenAI Meminta Pendekatan Berbeda Terhadap Kualitas Data

Mengelola kualitas data untuk kasus penggunaan genAI menuntut satu set keterampilan yang berbeda dari tim operasi. Ini juga membutuhkan pelatihan ulang tim untuk mengelola konsep-konsep baru. Secara garis besar, perubahan pikiran ini memiliki beberapa tema kunci:

Tim operasi harus lebih terkait dengan sumber daya teknis. Kemitraan keterampilan teknis dan wawasan bisnis ini krusial untuk menghasilkan tanggapan terpercaya dari alat genAI apa pun.
Peran penjaga data harus memperluas kemampuan mereka untuk menyediakan keahlian domain, mengambil peran baru sebagai pengantara generasi wawasan yang akurat.
Manajemen data harus beralih dari pembersihan dan pengendalian kumpulan data diskrit ke kurasi aktif dan berkelanjutan dari percakapan, baik permintaan maupun tanggapan.

Daftar untuk menghadiri B2B Summit North America dari Forrester untuk belajar bagaimana mempersiapkan bisnis Anda untuk perubahan besar yang sudah dihasilkan oleh genAI.

Tulisan ini ditulis oleh Analis Utama Brett Kahnke dan VP, Analis Utama Michele Goetz dan awalnya muncul di sini.