Trí tuệ nhân tạo: 101 điều bạn nên biết từ hôm nay về tương lai của chúng ta (Phần 4)

Hiệp Khách Quậy Khi bạn nghĩ về trí tuệ nhân tạo, có lẽ bạn sẽ hỏi những câu như sau: Tại sao AI quan trọng đến thế? Tại sao có quá nhiều hãng công nghệ lớn tập trung nỗ lực của họ vào việc phát triển và triển khai các công cụ AI? Xin mời đọc tiếp.

3. Phải chăng Dữ liệu là Dầu khí mới?

Khi bạn nghĩ về trí tuệ nhân tạo, có lẽ bạn sẽ hỏi những câu như sau: Tại sao AI quan trọng đến thế? Tại sao có quá nhiều hãng công nghệ lớn tập trung nỗ lực của họ vào việc phát triển và triển khai các công cụ AI?

Từ một quan điểm phát triển, một lí do hiển nhiên cho sự tăng trưởng AI là vì công suất xử lí máy tính đã tăng lên theo hàm số mũ, thành ra cho phép các máy tính xử lí các thuật toán càng phức tạp hơn. Đây chính là những thuật toán cao cấp đem lại sinh lực cho AI.

Dữ liệu là một yếu tố quan trọng khác đã thúc đẩy sự phát triển AI. Là yếu tố thuộc loại cơ bản nhất, không có dữ liệu thì sẽ gần như không thể tạo ra các sản phẩm và các ứng dụng AI.

Một câu nói cửa miệng trong cộng đồng công nghệ là “dữ liệu là dầu khí mới”. Ngày nay, các công ty danh giá nhất trên thế giới thường là các công ty có quyền truy xuất lượng dữ liệu khủng nhất. Không những dung lượng dữ liệu là quan trọng trong kinh doanh, mà chất lượng dữ liệu cũng thế.

Tuy nhiên, nhân danh cá nhân, tôi sẽ cãi rằng dữ liệu còn tốt hơn cả dầu khí. Trong những năm tháng khi mà dầu khí là một trong những hàng hóa danh giá nhất trên thế giới, chỉ có vài ba công ty có khả năng thu lợi từ nó. Tuy nhiên, ngày nay, khi hầu như ai ai cũng có thể học về nền tảng của AI và học máy và sử dụng những kĩ năng này sáng tạo ra các công cụ có giá trị, và người ta dễ dàng truy cập các nguồn dữ liệu miễn phí trên mạng, thì mọi người ai cũng được hưởng lợi từ giá trị của dữ liệu.

Truy cập dữ liệu

Trong thế giới hiện đại, chúng ta có dồi dào dữ liệu có thể sử dụng. Trái lại, 30 năm trước đây, hầu như chẳng có nhiều dữ liệu về chăm sóc sức khỏe, giao thông, tài chính, và các ngành công nghiệp và đề tài quan trọng khác, thế nên người ta không thể tạo ra các giải pháp nền tảng AI cho những vấn đề cơ bản trong những lĩnh vực này.

Sử dụng logic giống như vậy, có thể an toàn khi giả định rằng các công nghệ mà chúng ta có ngày nay sẽ còn mạnh hơn nữa trong mười năm tới và chúng ta sẽ có thể truy cập nhiều dữ liệu hơn nữa.

Bạn có thể tìm thấy một ví dụ của quan điểm này trong việc quan sát sự phát triển của ô tô tự lái và các thành phố kết nối thông minh. Thành phần nền tảng khiến những thứ này thành có thể là dung lượng dữ liệu có thể thu thập và phân tích để cải thiện hiệu năng của các hệ thống AI.

Phân tích dữ liệu thường dựa trên hai loại thông tin: dữ liệu có cấu trúc và dữ liệu phi cấu trúc. Để thật sự lĩnh hội được các hệ thống AI, điều quan trọng là phải nhận ra những khác biệt chủ chốt giữa hai loại dữ liệu này.

Theo lẽ thường tình, dữ liệu có cấu trúc được sử dụng thường xuyên hơn dữ liệu phi cấu trúc. Dữ liệu có cấu trúc bao gồm những input dữ liệu đơn giản như các giá trị số, ngày tháng năm, tiền tệ, hay địa chỉ. Dữ liệu phi cấu trúc bao gồm các kiểu dữ liệu thường phức tạp hơn để phân tích, ví dụ như văn bản, hình ảnh, và video. Tuy nhiên, sự phát triển của các công cụ AI khiến người ta có thể phân tích thêm nhiều kiểu dữ liệu phi cấu trúc, và các phân tích thu được khi ấy có thể dùng để đưa ra khuyến nghị và dự báo.

Các phân tích đầy sức mạnh sẽ cho phép chúng ta ứng dụng các công cụ AI trên toàn xã hội trong tương lai.

Dữ liệu

Hình 1.6 Dữ liệu có cấu trúc và dữ liệu phi cấu trúc

Theo Merrill Lynch ước tính thì từ 80 đến 90 phần trăm tổng lượng dữ liệu kinh doanh trên thế giới là phi cấu trúc, nghĩa là việc phân tích kiểu dữ liệu đặc biệt này là cực kì giá trị.10 Các kết quả từ việc phân tích dữ liệu phi cấu trúc này có thể đưa đến một số ưu thế trong xã hội hiện đại của chúng ta, bao gồm các lựa chọn chăm sóc sức khỏe tốt hơn, các kiểu giao thông an toàn hơn, và khả năng tiếp cận giáo dục tăng dần, cùng những lợi ích khác.

Công dụng của dữ liệu trong kinh doanh và trong xã hội

Dữ liệu đồ sộ còn giúp các doanh nghiệp lớn cải thiện các hoạt động đối nội và đối ngoại của họ. Kai-Fu Lee, một nhà tư bản mạo hiểm và là CEO của quỹ đầu tư Sinovation Ventures, làm rõ các lí do vì sao dữ liệu lại tối quan trọng đối với các hãng công nghệ lớn trong một mô tả gồm năm bước mà các công ty dùng để cải thiện các giải pháp AI của họ:

  • Thu thập nhiều dữ liệu hơn: Cỗ máy tìm kiếm Google chứa một lượng dữ liệu khổng lồ. Tương tự, Facebook sẽ không là một mạng xã hội quyền năng như thế nếu nó không tiếp cận được dữ liệu về các xu hướng xã hội của mọi người. Ý tưởng then chốt ở đây là các hãng công nghệ có thể sáng tạo những dịch vụ quyền năng và hữu ích đến mức người ta sẵn sàng cho phép dữ liệu của họ được dịch vụ đó sử dụng.
  • Sản phẩm được rèn giũa AI tốt hơn: Với Google và Facebook, trải nghiệm của bạn với vai trò một người dùng được tùy chỉnh sao cho thích hợp và hữu ích đối với bạn. Điều này có thể làm được bởi vì các công cụ nền tảng AI tạo ra được trải nghiệm cá nhân hóa.
  • Số lượng người dùng đông hơn: Khi người dùng có trải nghiệm tốt với một sản phẩm hay dịch vụ, họ có xu hướng đề xuất nó cho bạn bè của họ.
  • Doanh thu cao hơn: Số lượng người dùng đông hơn hầu như luôn luôn đồng nghĩa là doanh thu sẽ cao hơn.
  • Thu hút các nhà khoa học dữ liệu chất lượng cao và các chuyên gia học máy: Khi các công ty tăng doanh thu, họ sẽ có khả năng thu hút tốt hơn một số chuyên gia hàng đầu thế giới về AI.11

Cuối cùng, càng có nhiều nhà khoa học dữ liệu và chuyên gia học máy đến làm việc cho một công ty, thì nghiên cứu của họ về AI càng có ý nghĩa, từ đó cho phép công ty không những đáng giá hơn mà còn sẵn sàng hơn cho tương lai.

Năm bước này được minh họa trên Hình 1.7. Mặc dù các hãng công nghệ Mĩ được lấy làm ví dụ đặc biệt, song các bước này vẫn có giá trị đối với các công ti quốc tế khác dựa trên nền tảng AI, ví dụ như Alibaba, Baidu, và Tencent.

Dữ liệu là tối quan trọng đối với trí tuệ nhân tạo

Hình 1.7 Dữ liệu là tối quan trọng đối với trí tuệ nhân tạo

Bởi dữ liệu là một mảnh thiết yếu như thế trong sự phát triển của AI, thế nên nhiều chuyên gia yêu cầu các hãng công nghệ lớn nên công khai ít nhất một phần dữ liệu mà họ sở hữu để một số lượng lớn hơn các ứng dụng và sản phẩm hữu ích cũng có thể tận dụng các thông tin này.

Trong khi ý định này mang lại những câu hỏi quan trọng cần được trả lời, thì có một thực tế không thể nhầm lẫn rằng trong tương lai, điều quan trọng là phải có những tập hợp dữ liệu giống như vậy sẵn dùng cho sự phát triển tiếp tục của các sản phẩm và dịch vụ AI.

Chương này chỉ cung cấp một giới thiệu gắn gọn về tầm quan trọng của dữ liệu đối với AI, nhưng hi vọng rằng, khi bạn đọc, bạn sẽ bắt đầu nghĩ tới các ứng dụng nền tảng AI tiềm năng mà bạn có thể thiết kế hoặc phát triển trong tương lai. Như với nhiều chủ đề khác trong quyển sách này, nếu khái niệm này thu hút sự chú ý của bạn, tôi khuyên bạn nên tìm hiểu sâu thêm về nó một cách tường tận.

TRÍ TUỆ NHÂN TẠO: 101 ĐIỀU BẠN CẦN BIẾT TRONG HÔM NAY VỀ TƯƠNG LAI CỦA CHÚNG TA
Lasse Rouhiainen | Bản dịch của Thuvienvatly.com

<< Phần trước | Phần tiếp theo >>

Bài trước | Bài kế tiếp

Mời đọc thêm