Các nhà nghiên cứu OpenAI đã rất ngạc nhiên khi phát hiện ra một mạng lưới thần kinh được đào tạo để tiên đoán ký tự tiếp theo trong văn bản từ các bài đánh giá của Amazon.
Phần lớn trí tuệ nhân tạo ngày nay dựa vào phương pháp phân tích dữ liệu machine learning ( máy học): máy móc có thể trả lời hay tự động phản ứng sau khi nhận thông tin từ một bộ dữ liệu cụ thể. Thuật toán machine learning dự đoán các kết quả bằng cách sử dụng các giá trị được xác lập trước đó. Các nhà nghiên cứu OpenAI phát hiện ra rằng một hệ thống machine learning mà họ tạo ra để dự đoán ký tự tiếp theo trong văn bản trong các bài đánh giá của Amazon đã phát triển thành một hệ thống không có giám sát có thể nghiên cứu những biểu hiện của sự cảm tính.
OpenAI, công ty nghiên cứu phi lợi nhuận bao gồm những nhà nghiên cứu Elon Musk, Peter Theil và Sam Altman phát biểu trên một tờ bào: “ Chúng tôi rất ngạc nhiên vì mô hình của chúng tôi đã tạo ra một tính năng đơn giản là dự đoán ký tự tiếp theo trong các bài đánh giá của Amazon đã dẫn đến việc khám phá ra khái niệm về sự cảm tính”. Mạng lưới trung lập của OpenAI có khả năng tự đào tạo để phân tích cảm tính bằng cách phân loại các đánh giá tích cực hay tiêu cực và có khả năng hình thành văn bản khi độ cảm tình lên cao.
AI là những bộ nhớ ngắn dài hạn (LSTM) được đào tạo trong một tháng với “ 4096 đơn vị trên tổng số 82 triệu bài báo Amazon để dự đoán ký tự tiếp theo trong một đoạn văn bản.” Sau khi đào tạo bộ nhớ LSTM, các nhà nghiên cứu đã biến mô hình này thành biết máy phân loại cảm tính sử dụng kết hợp tuyến tính các đơn vị. Khi nhận thấy mô hình đang sử dụng quá ít đơn vị, họ khám phá ra rằng chỉ có một “ nơ-ron cảm tính” duy nhất có khả năng dự đoán cao.
Khả năng phân tích cảm tính của AI đã vượt qua mọi phương pháp khác được sử dụng trong bộ dữ liệu Treebank Sentiment Tree Stanford. AI tự hào vì độ chính xác 91,8% cao hơn mức trước đó là 90,2%.
Thuật toán unsupervised learning ( học không giám sát) là ước mơ của những nhà nghiên cứu machine learning. Nó cơ bản là một chiếc máy AI có thể tự nghiên cứu và không cần cung cấp dữ liệu đã sắp xếp sẵn cho nó. LSTM của OpenAI đã đạt được điều đó nhưng nó cũng không phải là chiếc máy duy nhất có khả năng như vậy.
“ Chúng tôi tin rằng hiện tượng này không chỉ có ở mô hình của chúng tôi nhưng nó là thay thế của một mạng lưới thần kinh được đào tạo để dự đoán các bước tiếp theo và dung lượng của dữ liệu đầu vào.”
Tính năng học không giám sát có thể làm cho AI phát triển đáng kể: giảm thời gian cần thiết để đào tạo, nâng cao hiệu quả làm việc. Ví dụ như một AI có thể cung cấp hỗ trợ kỹ thuật chuyên môn bằng cách phân tích, thậm chí dự đoán nhu cầu của người sử dụng. Nhưng các ứng dụng này vẫn cần nghiên cứ sâu hơn về phương hướng phát triển.
Các nhà nghiên cứu của OpenAI nói rằng: “ Thành quả này là một bước tiến đầy hứa hẹn. Chúng tôi đã tìm ra kết quả bằng cách khám phá xem liệu chúng ta có thể học cách biểu hiện tốt như hiệu quả của mô hình ngôn ngữ và sau đó hình thành mô hình chứa dữ liệu chọn lọc. Tuy nhiên, những hiện tượng đó vẫn còn là một bí ẩn.”