14:22' 03/02/2017
> Tin Tức
Rồi ai cũng có… ba đầu sáu tay!
      E-mail        
Phải chăng, robot mang bộ óc nhân tạo không phải là viễn cảnh xa vời? Rồi một ngày, bạn có thể yêu cầu chiếc điện thoại thông minh gọi bạn dậy lúc 5 giờ sáng, kéo rèm cửa sổ và mở một bản nhạc nhẹ nhàng đón chào bình minh…

Với sự phát triển của Internet của vạn vật (IoT) và trí tuệ nhân tạo (AI), cảnh tượng trên chẳng còn là viễn cảnh xa xôi mà thực tế nó đã diễn ra đâu đó trên thế giới, thậm chí ngay tại Việt Nam.


                                             Nguyễn Việt Quốc và nhóm bạn


Trong một căn phòng nhỏ tại Khu Công nghệ phần mềm Đại học quốc gia TPHCM, Nguyễn Việt Quốc, chàng giảng viên thế hệ 9X đang cùng cộng sự của mình “dạy” cho máy tính nghe, hiểu và thực hiện những yêu cầu của con người. Nói theo ngôn ngữ kỹ thuật thì Quốc đang trang bị cho máy tính một bộ óc nhân tạo, được gọi với cái tên thông dụng là trí tuệ nhân tạo. Bộ óc ấy mang tên Umind - một ứng dụng, về cơ bản, tương tự như Siri của Apple, nhưng nghe, hiểu và nói được tiếng Việt.


Thời sinh viên, Quốc học về công nghệ phần mềm, tốt nghiệp cử nhân Khoa học máy tính tại trường Đại học Công nghệ thông tin – Đại học Quốc gia TPHCM, lấy bằng thạc sĩ Kỹ thuật máy tính tại Hàn Quốc. Với nền tảng kiến thức lập trình, thuật toán và phần cứng, Quốc bắt tay xây dựng Umind để hiện thực hóa giấc mơ tạo ra một trợ lý ảo, trước là để con người đỡ vất cả trong việc nhà, sau là giúp cuộc sống con người thuận lợi hơn.


“Umind” được ghép từ hai chữ, “U” và “mind”. “Mind” chỉ cho trí tuệ. “U” là chữ cái đầu tiên trong từ UIT – viết tắt từ Trường ĐH Công nghệ thông tin – Đại học Quốc gia TPHCM – ngôi trường Quốc học và hiện đang làm giảng viên tại đây. Cái tên Umind, như Quốc chia sẻ, đại diện cho trí tuệsinh viên UIT và rộng ra cũng là sinh viên Việt Nam - những người trẻ có thể bắt kịp sự tiến bộ của công nghệ thế giới.


Bạn có thể làm gì với Umind? Nói nôm na, điều gì bạn thao tác được trên đện thoại thông minh thì bạn cũng có thể yêu cầu Umind thực hiện. Xin kể một đoạn đối thoại ngắn giữa người dùng và Umind:


-          Umind, mấy giờ rồi?

-          Bây giờ chính xác là 15 giờ 26 phút.

-          Hãy gọi mình dậy lúc 17 giờ.

-          Đã đặt báo thức lúc 17 giờ.

-          Bạn khỏe không?

-          Tôi khỏe, nhưng xin đừng nói về tôi mà hãy nói về bạn.

-          Hãy mở bài hát “Hello Việt Nam”.

-          Đã mở bài hát “Hello Việt Nam”.

Và rồi lời bài hát vang lên từ chiếc điện thoại mà người dùng đang nói chuyện

“Tell me all about thisname, that is difficult to say

It was given me the day I was born …”

 

Vậy Umind thực hiện những lệnh trên như thế nào? Về nguyên tắc, Umind được xây dựng để hoạt động như một con người khi giao tiếp: Nhận thông tin, phân tích và hành động. Umind được cấu thành từ 3 đơn vị khác nhau: đầu tiên là chuyển ngôn ngữ thành văn bản (speech to text), kế đến là xử lý văn bản và sau cùng là chuyển văn bản thành giọng nói (text to speech) để phản hồi người dùng.


Khi bạn nói với Umind rằng “hãy mở bài hát ABC”, quy trình xử lý của Umind sẽ diễn ra như sau: Đầu tiên, giọng nói của bạn sẽ chuyển thành văn bản, tức dòng chữ “Hãy mở bài hát…” sẽ hiện lên trên giao diện của Umind. Kế đó, văn bản này sẽ qua hệ thống xử lý máy học để chuyển thành ngôn ngữ máy tính, tức những đoạn mã, những dòng lệnh, rồi ngôn ngữ này sẽ được qua hệ thức (Knowledge base) để xử lý và đưa ra quyết định.


Như vậy, khi bạn yêu cầu “hãy mở bài hát..”, một chuỗi hành động sẽ diễn ra trong Umind, và ứng dụng này sẽ tìm kiếm tên bài hát trên Google để mở. Nếu có nhiều đường dẫn khác nhau cùng chỉ một bài hát thì Umind tự động chọn đường dẫn đầu tiên. Đây là nguyên tắc tối ưu trong thiết kế.


Thế nhưng tối ưu không hẳn lúc nào cũng tốt. Đặc biệt, điều tối ưu với máy móc không hẳn tối ưu với con người. Trong lúc đang chạy xe, một cộng sự của Quốc ra lệnh cho Umind nhắn tin “anh yêu em” gửi đến vợ. Cuối cùng dòng tin nhắn ngọt ngào ấy được Umind gửi đến số điện thoại của… mẹ vợ cộng sự. Sở dĩ sự cố trên xảy ra vì khi nhận lệnh, Umind sẽ tìm trong danh bạ và chọn cái tên đầu tiên nó thấy để gửi tin nhắn, mà theo thứ tự abc trong danh bạ thì chữ “mẹ vợ”, đứng trước từ “vợ”. Sự cố trên là một trong vô vàn vấn đề mà Quốc cùng cộng sự gặp phải trong quá trình “dạy” Umind học ngôn ngữ của người Việt.


Dĩ nhiên, Umind chỉ có thể thực hiện những gì được học trước đó. Với những gì chưa được học, Umind sẽ không đưa ra câu trả lời phù hợp. Ví dụ, khi bạn hỏi Umind rằng: “Bạn có người yêu chưa?”, Umind đáp: “Bạn nói gì vậy? Tôi không hiểu”.


Tất cả các cuộc trò chuyện của Umind, trong quá trình hoàn thiện, đều được ghi nhận và đánh giá. Với những yêu cầu mà Umind không thực hiện được, đội của Quốc sẽ xem lại dữ liệu và cập nhật cho Umind tình huống mới. Lần kế đến, nếu bạn hỏi Umind: “Bạn có người yêu chưa?”, Umind sẽ đáp: “Bớt giỡn đi. Người máy thì làm sao yêu được”.


Bạn thấy đó, Umind có thể hài hước, cũng có thể nhát gừng, có thể thông thái nhưng đôi khi cũng ngớ ngẩn. Bởi đơn giản, Umind là một cậu học trò ngoan làm theo đúng theo những gì đã học được. Thầy sao thì trò vậy. danh sư xuất cao đồ.


Hiện Umind đang được sử dụng thử nghiệm trong một cộng đồng nhỏ để hoàn thiện nhất có thể trước khi đưa ra thị trường. Các tính năng cơ bản Quốc đang xây dựng cho Umind gồm có báo thức, chỉ đường, mở nhạc, gọi điện, gửi tin nhắn, đọc báo và tắt/mở đèn. Để có thể yêu cầu Umind tắt/mở đèn, điều tiên quyết là hệ thống đèn phải được kết nối với chiếc điện thoại. Ở đây, ta thấy sự xuất hiện của lĩnh vực IoT. Với IoT kết hợp cùng AI, Umind càng trở nên hữu ích với người dùng. Vậy nên những gì bạn có thể điều khiển trên điện thoại thông minh, bạn hoàn toàn có thể yêu cầu Umind thực hiện.


Bây giờ thử hình dung bạn đang lái ô tô mà có một trợ lý như Umind hẳn sẽ thật thuận tiện. Bạn muốn mở hay chuyển đổi một bài hát, đọc tin nhắn vừa đến, trả lời tin nhắn vừa nhận được, tìm đường đi trên bản đồ…, bạn có thể yêu cầu Umind thực hiện thay mình.


Một tình huống khác. Bạn là một biên dịch viên gạo cội, thường xuyên dịch sách và các tài liệu từ tiếng Anh sang tiếng Việt. Tốc độ suy nghĩ và chuyển ngữ trong đầu bạn nhanh hơn so với đánh máy. Thay vì đánh máy, bạn đọc và Umind sẽ chuyển lời nói của bạn thành văn bản. Hoàn thành xong văn bản, bạn có thể ra lệnh cho Umind gởi văn bản này đến khách hàng. Rõ ràng trong trường hợp này, Umind giúp năng suất làm việc của bạn tốt hơn và cho phép đô bàn tay của bạn rời khỏi bàn phím để nghỉ ngơi.


Những ứng dụng tương tự cũng có thể áp dụng cho nhân viên văn phòng, chẳng hạn yêu cầu Umind thực hiện những công việc mang tính lặp đi lặp lại, tìm in các tài liệu theo yêu cầu…


Nhìn xa hơn một xíu, bạn có thể trang bị Umind vào một con robot và bạn sẽ có một trợ lý như thật. Khi ấy, hẳn chuyện có “ba đầu sau tay” không còn là giấc mơ. Nếu không có robot, không sao, bạn vẫn dùng Umind, vẫn có 3 đầu, thậm chí nhiều hơn …


Kế hoạch trước mắt, Quốc mong muốn phục vụ thật tốt người dùng trước khi tính đến chuyện xây dựng mô hình kinh doanh xoay quanh sản phẩm. Để biến từ 1 đến n không dễ, nhưng để có thể từ 0 đến 1 thì khó hơn rất nhiều. và hiện Quốc cùng cộng sự đang làm điều khó khăn đó cho những bước đi xa hơn.


Trước kia, khi Larry Page và Sergey Brin xây dựng Google, họ mong muốn đem lại cho mọi người một cỗ máy tìm kiếm tiện lợi. Và khi sự tiện lợi đem lại giá trị cho khách hàng, cỗ máy tìm kiếm lại trở thành cỗ máy sinh tiền. Umind, biết đâu đó, sẽ là một câu chuyện tương tự.


Theo Đức Tâm (TBKTSG)

In bài
  Ý kiến của bạn
Họ tên : E-mail (*):
Tiêu đề :
Nội dung ý kiến :
Lưu ý: (*) là bắt buộc nhập
Các tin khác
Xem theo ngày :
Quảng cáo 2nd
Quy trình mang trái dừa ...
 
ĐĂNG KÝ NHẬN BẢN TIN BSA
 
Flash MP3 Player
12 CA KHÚC
Hát về hàng Việt

  QUẢNG CÁO 
Designed & Implementation by VietPho Co., Ltd.