Tại sao lại cần xây dựng mô hình ngôn ngữ mở cho tiếng Việt?
Trong bài viết Cùng chung tay xây dựng mô hình ngôn ngữ lớn thuần Việt mình kêu gọi mọi người cùng nhau đóng góp dữ liệu để xây dựng mô hình ngôn ngữ mở cho tiếng Việt. Trong phạm vi một bài viết kêu gọi, mình chưa thể giải thích kỹ lưỡng các vấn đề liên quan tới mô hình ngôn ngữ, chúng quá mới mẻ nên cần một bài viết riêng để giải thích kỹ lưỡng hơn. Đây cũng là bài viết để giải đáp các câu hỏi mình nhận được từ bài viết trước đó.
Cùng chung tay xây dựng ChatGPT tiếng Việt dữ liệu mở
Cơ hội lớn để xây dựng mô hình ngôn ngữ 20 tỉ tham số cho tiếng Việt, được hỗ trợ siêu máy tính và chuyên gia từ quốc tế. Việc của chúng ta là xây dựng tập dữ liệu đủ lớn để huấn luyện mô hình.
Chúng ta không có lợi thế và OpenAI cũng vậy
Tài liệu nội bộ của Google cho rằng trí tuệ nhân tạo nguồn mở sẽ vượt qua Google và OpenAI.
Bài học đắng trong AI
Bài học lớn nhất rút ra từ 70 năm trong AI là, những phương pháp tổng quát tận dụng sức mạnh tính toán cuối cùng lại là những phương pháp hiệu quả nhất và vượt xa các phương pháp khác.