Rõ ràng phải thừa nhận rằng tiếng Việt là một hệ thống ngôn ngữ rất giàu và đẹp. Và cũng sẽ chẳng có ai có thể tự tin nói rằng mình sử dụng thành thạo và không sai tiếng Việt được. Với sự đa dạng về từ ngữ, cách diễn đạt, ý nghĩ thì không quá khi nào rằng tiếng mẹ đẻ của chúng ta không hề đơn giản. Để tăng thêm tình yêu tiếng Việt và giúp hiểu rõ hơn về ngôn ngữ này rất nhiều cuộc thi đã được tổ chức. Mới đây nhất ở thành phố Hồ Chí Minh có phát động cuộc thi ý tưởng về AI để có thể nhận diện tiếng Việt.
Mục Lục
Ứng dụng AI trong nhận diện tiếng Việt
Sáng 3/11, Sở Thông tin Truyền thông TP HCM phối hợp với Thành đoàn thành phố và VinAI phát động cuộc thi Thử thách trí tuệ nhân tạo 2021 (AI Challenge). Chủ đề là “Nhận diện chữ tiếng Việt trong ảnh ngoại cảnh và sinh hoạt hàng ngày”. Mục tiêu cuộc thi là phát hiện và nhận diện chữ trong khung cảnh. Đây đều là chữ được thu lại từ nhiều nguồn camera khác nhau.
Việc thu thập hình ảnh có chữ tiếng Việt làm cơ sở xây dựng dữ liệu cho nhiều hệ thống thông minh hiện nay. Ví dụ như robot, xe tự lái… ứng dụng trí tuệ nhân tạo. Các hệ thống này có thể hiểu được cảnh vật xung quanh. Đó là nhờ việc phân tích chữ viết để phát triển du lịch thông minh. Thăm quan bảo tàng thông minh, xe tự lái, robot tự hành… Phát triển các ứng dụng phân tích ảnh có chữ tiếng Việt. Từ đó có thể hỗ trợ người nước ngoài, người khiếm thị thông tin về môi trường sống xung quanh. Đặc biệt là những nơi họ mới đến.
Nội dung của cuộc thi
Trong cuộc thi này, mục tiêu đặt ra là phát hiện (detect) và nhận diện (recognize) chữ trong ảnh. Cụ thể ở đây sẽ tập trung vào chữ trong khung cảnh (scene text). Đây là những cái được thu lại từ nhiều nguồn camera khác nhau ở Việt Nam.
Vấn đề đặt ra là một phần quan trọng cho nhiều hệ thống thông minh hiện nay như robot, xe tự lái… Các hệ thống này yêu cầu hiểu được cảnh vật xung quanh. Chữ trong cảnh vật nắm giữ rất nhiều thông tin quan trọng. Từ đó có thể phục vụ phát triển du lịch thông minh, bảo tàng thông minh, xe tự lái, robot tự hành… Làm sao có thể tăng tính ứng dụng thực tiễn của giải pháp? Mô hình cần đáp ứng tốt được cả về độ chính xác cũng như về thời gian xử lý.
Cuộc thi được tổ chức theo hình thức cuộc thi khoa học (challenge). Nó tương tự các cuộc thi được tổ chức trên thế giới nhằm tìm kiếm các ý tưởng, giải pháp hiệu quả cho các vấn đề mới đang được quan tâm nhằm phục vụ cuộc sống.
Giải pháp công nghệ cho chữ tiếng Việt
Theo GS.TS Nguyễn Minh Hoài, đại diện Viện VinAI, Trưởng ban giám khảo cuộc thi, đơn vị tổ chức sẽ cung cấp dữ liệu về 2.000 ảnh dán nhãn thủ công. Trong đây chứa hơn 56.000 từ chuyên dùng và 1.000 ảnh trong bộ dữ liệu kiểm thử. Từ đó các nhóm dự án phát triển ứng dụng huấn luyện cho trí tuệ nhân tạo. Ban tổ chức khuyến khích các giải pháp huấn luyện AI có tốc độ xử lý không quá 10 giây mỗi ảnh.
“Tìm kiếm giải pháp công nghệ cho chữ tiếng Việt là một chủ đề hay. Nó sẽ tạo sân chơi cho các bạn trẻ. Và cũng tìm kiếm những giải pháp công nghệ có thể ứng dụng thực tế”. GS Hoài nói và cho biết đơn vị sẽ hỗ trợ cho những ý tưởng có tính ứng dụng cao. Từ đó nhằm để phát triển các bước tiếp theo.
Về phía đơn vị chủ trì, ông Lê Quốc Cường, Phó giám đốc Sở Thông tin và Truyền thông TP HCM cho biết. Cuộc thi nhằm tìm kiếm nguồn nhân lực và giải pháp thiết thực phục vụ cho phát triển kinh tế, xã hội thành phố. Giúp thành phố phục hồi sau Covid-19. Những ý tưởng tốt sẽ được chính quyền thành phố giới thiệu đến các doanh nghiệp để hỗ trợ ứng dụng thực tế.
Cuộc thi sẽ nhận hồ sơ dự thi từ nay đến hết tháng 11. Vòng chung kết và công bố dự án đạt giải nhất diễn ra vào tháng 12. Dự án giành giải nhất sẽ nhận thưởng 50 triệu tiền mặt. Ngoài ra còn có các hỗ trợ về đăng ký đề tài khoa học, sở hữu trí tuệ…