Đỗ Quốc Trình, đồng sáng lập kiêm Giám đốc Phát triển kinh doanh Công ty TNHH Trí thông minh Nhân tạo Việt Nam (VAIS), đơn vị giành quán quân Nhân tài Đất Việt 2019 trong lĩnh vực CNTT, đã chia sẻ về hành trình đầy cảm xúc ấy.
Xông ra chiến đấu và có thể “chết” sau 6 tháng
– Vì sao anh và nhóm tác giả của VAIS lại lựa chọn đầu bài khó đến thế bởi tiếng Việt là một trong những ngôn ngữ khó học, khó phát âm nhất trên thế giới?
– Công nghệ nhận dạng giọng nói đã có từ lâu nhưng những “ông lớn” như Google chưa phát triển những nền tảng dành riêng cho người Việt một cách triệt để. Vì thế, việc chuyển đổi giọng nói thành chữ viết tiếng Việt với độ chính xác cao là điều chúng tôi rất trăn trở. Chúng tôi đặt ra câu hỏi “Ai sẽ giải bài toán của Việt Nam nếu không phải chính người Việt?” và lên ý tưởng sử dụng trí tuệ nhân tạo (AI) để xử lý câu chuyện này.
– Trước đó, Origin-STT được nhắc tới khi gỡ băng cho các phiên chất vấn của Quốc hội với độ chính xác cao. Theo anh, dự án có thể ứng dụng ra sao trong cuộc sống?
– Origin-STT là công nghệ lõi, gỡ băng trong các phiên họp chỉ là một trong những ứng dụng thiết thực. Ngoài ra, Origin-STT có thể sử dụng cho các nhà báo tác nghiệp hoặc tại các bệnh viện, nơi bác sĩ vừa khám bệnh vừa đọc chẩn đoán, các cảnh báo, lưu ý và phần mềm sẽ tự động xuất ra bệnh án điện tử.
Công nghệ này cũng có thể ứng dụng để hỗ trợ ghi biên bản điều tra hiện trường, trong các phiên tòa, với tổng đài dịch vụ hay phát triển hỗ trợ cho người khuyết tật…
– Phần lớn startup phải rời bỏ thị trường chỉ trong thời gian ngắn ban đầu vì hết tiền và không thể gọi vốn. Với VAIS, các anh đang vượt qua quãng thời gian này ra sao?
– VAIS được thành lập tháng 8/2018 với 5 thành viên, phần lớn đều là thế hệ 9X. Trước đó, mọi người đều đang có những công việc với thu nhập tốt, có thể nói là đáng mơ ước. Bản thân tôi trước đó cũng đang làm ở KPMG Việt Nam (một trong những tập đoàn kiểm toán nằm trong nhóm Big Four). Tuy nhiên, anh em đã xác định tinh thần, cùng xông ra ngoài chiến đấu.
Thời gian đầu, toàn bộ kinh phí hoạt động là tiền tích góp trong vài năm đi làm của 5 thành viên. Chúng tôi tính toán, nếu không có thu nhập, công ty chỉ hoạt động được 6 tháng. Tuy nhiên, tôi và 4 người bạn cùng nghĩ sẽ “chơi hết mình”.
May mắn là ngay trong những tháng đầu tiên, chúng tôi đã nhận được một dự án lớn hợp tác với trang thương mại điện tử Adayroi. Sau đó, chúng tôi nhận được sự tin tưởng và hỗ trợ tài chính quan trọng từ Quỹ Đổi mới sáng tạo Vingroup (VinIF).
VinIF đã tạo cảm hứng, giúp chúng tôi đi nhanh
– Cảm giác có dự án đầu tay như thế nào, nhất là với những ông lớn như Adayroi?
– Cả nhóm rất mừng vì dù xác định từ đầu là xông ra chiến đấu, nhưng nếu không có tiền, mọi sự phát triển chỉ là trên giấy. Phải có tài chính, anh em mới lên được kế hoạch cho công việc một cách chính xác.
Với dự án đầu tay, nhóm đã giúp cải thiện khả năng tìm kiếm trên website. Ngoài ra, chúng tôi cũng phát triển chatbot (chương trình tương tác tự động với người dùng qua tin nhắn hoặc âm thanh). Điểm khác biệt là hệ thống chatbot này là có thể tự học hỏi thêm để nhận biết các tình huống khác nhau thay vì chỉ “bắt cứng” từ khóa như những chương trình khác.
– Sự hỗ trợ của Quỹ Đổi mới sáng tạo Vingroup (VinIF). Điều này có ý nghĩa ra sao trong hành trình của VAIS?
– VinIF đã đặt niềm tin vào chúng tôi, đó là điều ý nghĩa. Chúng tôi đã may mắn có cơ hội tiếp xúc với Giám đốc khoa học của quỹ là giáo sư Vũ Hà Văn – một nhà khoa học lừng danh thế giới. Được những vị giáo sư như anh Văn đánh giá đây là một nền tảng tốt chính là sự ghi nhận với chúng tôi.
Chính sự tin tưởng và hỗ trợ của VinIF đã tạo ra động lực, cảm hứng, giúp anh em duy trì và đưa startup của mình đi nhanh hơn.
– Bước đi đầu tiên với VinIF đã giúp cả nhóm ra sao trên con đường vươn tới giải nhất Nhân tài Đất Việt sau đó?
– Dự án đã tạo tiền đề cho chúng tôi không chỉ về tài chính mà về kỹ thuật, việc nghiên cứu cũng giúp nhóm nâng cao được chất lượng nhận dạng ngôn ngữ tự nhiên.
Đơn cử, chúng tôi đã nghiên cứu để chương trình của mình hiểu được các ngữ cảnh khác nhau, từ đó “đoán” chữ chính xác hơn trong từng câu văn. Đây là một phần quan trọng của sản phẩm Origin-STT sau đó.
– Hướng đi trong tương lai của VAIS là gì sau giải Nhân tài Đất Việt và xa hơn nữa?
– Với phần mềm tự động chuyển đổi giọng nói tiếng Việt sang văn bản, điều chúng tôi muốn là cải thiện công nghệ lõi để nhận dạng và chuẩn hóa văn bản tốt hơn. Trong tháng 12, chúng tôi sẽ chính thức ra mắt Origin-STT với độ chính xác cao và có cả ứng dụng trên các thiết bị di động.
Tuy nhiên, nhìn rộng hơn, điều chúng tôi hướng tới là nền tảng mở để các nhà sáng lập tự phát triển thêm các ý tưởng.
Phần mềm tự động chuyển đổi tiếng nói tiếng Việt sang văn bản (Origin-STT) có độ chính xác trung bình lên tới 93,6%. Origin-STT có thể nhận dạng giọng nói ở cả 3 miền Bắc, Trung, Nam với khoảng 7.000 từ tiếng Việt.
Origin sẽ giúp người dùng tiết kiệm phần lớn thời gian, công sức nghe lại âm thanh và gõ lại văn bản (gỡ băng). Trung bình, với một đoạn băng dài 60 phút, phần mềm chỉ cần 6 phút để hoàn thành việc chuyển đổi. Qua đó, Origin-STT có thể hỗ trợ tốt cho nhà báo tác nghiệp, giúp bác sĩ làm bệnh án điện tử hay ứng dụng cho ghi biên bản các phiên tòa, tổng đài dịch vụ…
Theo Zingnews.vn
Ngày Từ 25/04/2020, FSI chính thức trở thành nhà đồng hành phát triển chiến lược của Phần mềm tự động chuyển đổi tiếng nói tiếng Việt sang văn bản (Origin-STT). Sau khi ký kết thành công, FSI và VAIS đã bàn bạc và đi đến thống nhất đổi tên phần mềm từ Origin STT sang phần mềm chuyển đổi giọng nói thành văn bản V-IONE. Sự hợp tác giữa Công ty CP Đầu Tư Thương Mại và Phát Triển Công Nghệ FSI và Công ty Cổ Phần Giải Pháp Trí thông minh Nhân tạo Việt Nam (VAIS) sẽ đưa các ứng dụng nhận dạng giọng nói “thuần Việt” đến gần hơn với người dùng trong nước.
https://zingnews.vn/du-an-origin-stt-ung-dung-ai-chuyen-doi-giong-noi-thanh-chu-tieng-viet-post1024592.html