Thứ Tư, 16 tháng 4, 2014

Đằng sau sự ra đời của Cortana - Tính năng nhận diện giọng nói mới trên Windows Phone 8.1

2453438_Tinhte_ms_cortana.

Tại hội nghị Build 2014 diễn ra vừa qua, Microsoft đã chính thức cho ra mắt bản cập nhật Windows Phone 8.1 với rất nhiều thay đổi, và bổ sung đáng giá. Tập đoàn công nghệ Mỹ vô cùng hào hứng công bố từng tính năng nổi bật của WP8.1 như Action Center, màn hình Start được tuỳ biến, màn hình khoá trực quan hơn,...và đặc biệt họ dành phần lớn thời gian để chú trọng vào một chức năng đầy hứa hẹn, sẽ xuất hiện rộng rãi trên các máy Windows Phone trong tương lai: đó là trợ lý ảo Cortana.

Nếu như Google có Google Now, Apple có Siri, thì giờ đây Microsoft hay Windows Phone cũng không chịu kém cạnh với Cortana - "cô trợ lý ảo" mà theo Microsoft là được ra đời dựa vào sự kết hợp những điểm tốt nhất của hai dịch vụ từ hai hãng đối thủ, nhưng vẫn giữ được những nét độc đáo riêng. Cortana dí dỏm, thông minh, và được thiết kế sao cho gần giống với một trợ lý thật sự của con người - đó là những thành quả mà Microsoft đã phải tốn hơn hai năm phát triển mới đạt được. Rồi giờ đây, Cortana đã hoàn thiện và đã đến với WP8.1 trong bối cảnh tập đoàn công nghệ Mỹ đang bắt đầu bắt kịp thế giới di động.

Để chúng ta có một cái nhìn rõ nét hơn về Cortana, bài viết này sẽ nói sơ qua về nguồn gốc của Cortana, cách mà Cortana hoạt động.

1. Sự ra đời của Cortana

Screen Shot 2014-04-14 at 9.13.53 PM.
Microsoft đã lấy ý tưởng Cortana trên series game Halo​

Dựa vào một nhân vật thông minh nhân tạo trong series game nổi tiếng Halo (game do Microsoft Game Studio phát hành), Cortana được ra đời với vai trò là một "nhân vật ảo" trên các thiết bị di động chạy Windows Phone 8.1. Thực tế, cái tên Cortana bắt nguồn từ một đề xuất đơn giản của vị quản lý chương trình Windows Phone, ông Robert Howard, khi ông này đang dự một buổi thảo luận. "Nó chỉ là một tên mã", Marcus Ash, quản lý nhóm phần mềm của Windows Phone giải thích. "Chúng tôi đã không có ý định lấy tên đó làm tên của một sản phẩm thực tế ngay từ giai đoạn đầu". Thực tế Cortana chỉ tồn tại bởi vì nó là Cortana, nó không phải là một cái tên quá kêu, một cái tên mang đầy tính "quảng bá" như "Microsoft Personal Digital Assistant Home Premium" - đáng ngạc nhiên là những cái tên dài và phức tạp đó chính là cách đặt tên truyền thống của Microsoft đối với các sản phẩm của họ.

Và thật bất ngờ hơn khi chỉ vài tuần trước khi công bố Windows Phone 8, đội ngũ phát triển vẫn chưa rõ Cortana có phải là tên gọi cuối cùng hay không, bởi có hàng tá cái tên khác như Naomi, Alyx,...tuy nhiên chính nhờ những tin đồn, những thông tin rò rỉ về cái tên Cortana, và đặc biệt là một bản đề xuất được gởi lên Microsoft, tất cả đã giúp tập đoàn công nghệ Mỹ đưa ra quyết định cuối cùng: đó chính là Cortana.

Dựa vào một nhân vật thông minh nhân tạo trong series game nổi tiếng Halo, Cortana được ra đời với vai trò là một "nhân vật ảo" trên các thiết bị di động chạy Windows Phone 8.1

Cái tên và hoàn cảnh ra đời của Cortana được gắn liền trực tiếp với tựa game hành động nổi tiếng, Halo, và nó cũng thích hợp với mục tiêu chính của Microsoft: tái tạo lại một trợ lý cá nhân thực tế mà không trở nên một cái gì đó quá ghê gớm. Cortana đã luôn luôn ở bên cạnh Master Chief trong game Halo, và bây giờ cô ấy sẽ luôn ở bên bạn ở trên điện thoại, nhưng sự khác biệt đó là chỉ khi nào bạn cần thì cô ấy mới xuất hiện. Đây cũng chính là điểm mạnh mà Microsoft muốn đề cập khi nói đến Cortana.

2. Notebook của Cortana

cortana.

Như chúng ta đều biết, dịch vụ Google Now của Google luôn luôn tìm cách tiếp cận sâu đến dữ liệu từ những thiết bị - mặc dù điều này cũng mang lại một số lợi ích, nhưng đôi khi nó sẽ khiến bạn bực mình bởi các thông báo được gởi đến một cách liên tục, hay sẽ khiến người dùng cảm thấy bất an bởi hệ thống máy biết quá nhiều về họ. Để ngăn ngừa điều này, Microsoft đã có nhiều buổi thảo luận với các chuyên gia về lĩnh vực trợ lý cá nhân cấp cao (là những người chuyên nghiên cứu và có nhiều năm kinh nghiệm trong lĩnh vực phát triển trợ lý ảo cho smartphone), và Microsoft nhận thấy rằng giải pháp tạo ra một notebook trong đó lưu giữ tất cả các thông tin cần thiết, thông tin quan trọng của người dùng (Cortana chỉ được phép truy cập với những thông tin trong notebook) là một ý tưởng thực tế.

Chính ý tưởng đơn giản đó đã truyền cảm hứng cho Microsoft tạo nên một "Notebook" ảo cho Cortana - là nơi lưu giữ các thông tin cá nhân và bất cứ thứ gì Cortana được phép truy cập và sử dụng. Nó không phải là một nơi kiểm soát sự riêng tư, nhưng đó là một danh sách liệt kê ra tất cả những gì Cortana được quyền biết về bạn. "Đó (Notebook) là cái nhìn của cô ấy về bạn, nhưng rõ ràng rằng bạn có thể lấy đi cái quyền đó từ cô ấy bất kỳ lúc nào và nói rằng "Điều đó là không đúng, tôi không muốn bạn biết điều này" hay là "Tôi không thoải mái với việc bạn đang đọc email của tôi", Ash giải thích. Vì vậy bạn hoàn toàn kiểm soát những gì cô ấy biết và cô ấy sẽ rõ ràng với bạn về những điều đó".

"Notebook" cho Cortana - là nơi lưu giữ các thông tin cá nhân và bất cứ thứ gì Cortana được phép truy cập và sử dụng

Bạn cũng có thể chia sẻ thông tin liên lạc, cũng như là sở thích, những điều bạn quan tâm, địa chỉ nhà, cơ quan, và nhiều điều khác với Cortana - tất nhiên là nếu bạn muốn làm vậy. Tất cả các thông tin này sẽ được lưu vào Notebook và được lưu trữ trên mây. Ngoài ra, Cortana cũng có thể vận hành và thực hiện các chức năng như học hỏi những thói quen và sở thích dựa vào cách sử dụng điện thoại, vị trí dùng hay cách giao tiếp của người dùng. Bạn cũng có thể nói trực tiếp với Cortana hay nhập liệu văn bản, nhưng dù có thế nào thì cô ấy sẽ luôn luôn hỏi bạn trước khi lưu bất kỳ thông tin nào vào Notebook.

Như vậy qua những gì đã đề cập ở trên, có thể hiểu được là khái niệm hoạt động của Cortana đó là nó sẽ đóng vai trò như một trợ lý cá nhân cùng với đó là một cuốn notebook - trái ngược với việc theo dõi gây bất an cho người sử dụng - và chính khái niệm này đã ăn sâu vào đầu của những kỹ sư phát triển ngay từ giai đoạn đầu tiên.

3. Cách hoạt động của Cortana

Screen Shot 2014-04-14 at 9.16.24 PM.

Khi bạn lần đầu tiên khởi chạy Cortana, cô ấy sẽ đưa ra một vài câu hỏi để tìm hiểu về bản thân bạn, ví dụ như tên của bạn, thức ăn ưa thích, thể loại phim bạn muốn xem,...Sau đó, khi dịch vụ đã được kích hoạt bằng nút tìm kiếm của Windows Phone, bạn có thể vuốt xuống để xem trước các thông tin mà mình cho phép Cortana truy cập. Nhìn chung, cách thể hiện của Cortana khá giống với những tấm thẻ của Google Now - cũng là các thông tin về những chuyến bay, kết quả thể thao, chứng khoán, và một vài thứ nữa mà Cortana đã học được và đưa vào Notebook.

Một điều khá thú vị là bạn có thể "nâng cấp" Notebook một cách thủ công bằng việc thêm vài thông tin nữa như sở thích cá nhân, lịch nhắc nhở, tin tức hay những dữ liệu quan trọng. Tóm lại, Notebook hay Cortana thực sự là một trung tâm tập hợp các thông tin, biến thông tin thành những tấm thẻ, và một số phần thông tin cho phép bạn pin ra ngoài màn hình Start Screen dưới dạng các ô Live Tiles, hay bạn cũng có thể thiết lập thông báo cho một số thông tin trên trong mục Action Center của Windows Phone 8.1 - ví dụ sau sẽ giúp bạn hiểu rõ hơn, khi một đội bóng mà bạn yêu thích ghi bàn, Cortana sẽ ngay lập tức gởi thông báo đến bạn qua Action Center. Hoặc, khi bạn đang đi du lịch nước ngoài, bạn sẽ được cập nhật thông tin về thời tiết, tỷ giá hối đoái, và bản đồ. Hay nếu bạn đang nhắn tin hay đang soạn email, Cortana sẽ để ý đến các yếu tố như "hãy gặp nhau lúc 8 giờ tối", từ đó giúp bạn dễ dàng hơn trong việc đặt lịch nhắc nhở cho cuộc hẹn.

Một trong những tính năng hữu ích nhất của Cortana đó là khả năng tự động hoá một số hành động dựa vào một vài sự việc được thiết lập sẵn

Một trong những tính năng hữu ích nhất của Cortana đó là khả năng tự động hoá một số hành động dựa vào một vài sự việc được thiết lập sẵn - khá giống với cách làm việc của công cụ If This Then That (IFTT) trên iOS và Android. Ví dụ, khi bạn nói "Nhắc nhở tôi rằng, vào lần tới khi tôi gọi vợ tôi, chúng tôi cần nói chuyện về Kevin", lúc này Cortana sẽ tạo ra một nhắc nhở và nó sẽ tự động nhắc bạn khi bạn gọi điện thoại cho vợ, hay vợ gọi cho bạn. Đây rõ ràng là một tính năng rất hay, và càng hay hơn khi Cortana thậm chí còn gây ấn tượng mạnh mẽ bởi các câu hỏi tìm kiếm cơ bản. Ví dụ bạn hỏi "Nhà hàng tốt nhất nào đang ở gần chỗ tôi", bạn sẽ không phải nhận một danh sách dài về các nhà hàng ở gần nơi bạn ở (cách mà Siri đang làm hiện nay), thay vào đó Cortana sẽ chỉ đưa ra tên của một nhà hàng duy nhất và tốt nhất dựa vào mức độ đánh giá của người dùng trang Yelp (trang chuyên đánh giá, đưa ra các lời khuyên về nhà hàng, các địa điểm ăn uống, shopping, dịch vụ,...).

"Nếu bạn hỏi một trợ lý thật (ý là trợ lý của bạn - người thật nha!) câu hỏi như trên", cô ấy cũng sẽ cầm một danh sách các cửa hàng đến cho bạn, và bạn sẽ muốn bắn cô ấy và tìm một người trợ lý khác", Rob Chambers, quản lý nhóm phần mềm của Bing, nói đùa. Sự khác biệt đó là nếu bạn hỏi về số nhiều, tức là "những cửa hàng tốt nhất", thì bạn sẽ nhận được một list các cửa hàng, nhưng khi bạn hỏi số ít như "cửa hàng tốt nhất" thì bạn chỉ nhận được một cửa hàng. Cortana có thể làm được điều như vậy nhờ vào khả năng hiểu giọng nói và bối cảnh xung quanh. Thật sự ấn tượng hơn nữa là khi bạn chỉ cần đơn giản hỏi một câu như "gọi nó", hay hỏi "cho tôi phương hướng", sau khi nhận được câu trả lời về cửa hàng tốt nhất, Cortana lúc này sẽ hiểu bạn đang muốn gọi nhà hàng tốt nhất đó, bạn đang cần tìm phương hướng đến nhà hàng đó, bởi Cortana có khả năng nhớ và lưu giữ lại câu hỏi trước đó của bạn. Đây quả thật là khả năng tìm kiếm nhiều bước, một cách mà ở đó câu hỏi nối tiếp câu hỏi để hoàn thành các tác vụ phức tạp mà chỉ dựa vào giọng nói.

Trong Windows Phone 8.1, Cortana xuất hiện dưới hình dạng của một vòng tròn, nhưng điều này không có nghĩa rằng cô ấy không có cá tính. Tương tự như những trợ lý ảo khác, như Siri của Apple chẳng hạn, tính cách của Cortana sẽ được thể hiện thông qua việc sử dụng hằng ngày. Hãy hỏi cô ấy, "Ai là cha đẻ của bạn?", và Cortana sẽ đáp lại, "Nói về mặt kỹ thuật, đó là Bill Gates. Không có gì to tát". Những câu truy vấn khác sẽ cho ra những câu phản hồi dí dỏm, và một vài câu trả lời sẽ có phần thêm sinh động với sự xuất hiện của một trong 16 cảm xúc khác nhau. Tất nhiên, không phải vì thế mà Cortana sẽ luôn trả lời bạn như vậy, vài trường hợp, Cortana sẽ không phản hồi lại bạn với cảm xúc hay các hình ảnh vui nhộn. Tuy nhiên, Microsoft đang muốn Cortana phải linh hoạt hơn nữa, tập đoàn hình dung ra một tương lai mà ở đó Cortana có thể phản ứng, đưa ra cảm xúc với các kết quả thể thao hay những sự kiện khác, ví dụ như Cortana sẽ buồn khi đội bạn thua, vui khi thắng, bởi bất kỳ một trợ lý tốt nào cũng đều thể hiện như vậy. "Có nhiều việc để chúng tôi có thể làm với ý tưởng đó bởi chúng tôi đang phát triển dọc theo kế hoạch này", Ash giải thích.

Microsoft cũng đã làm việc trực tiếp với đội ngũ của 343 Industries về các yếu tố thị giác, cùng với đó là diễn viên lồng tiếng Jen Taylor - người chịu trách nhiệm về phần âm thanh của Cortana. Nếu như các bạn không biết thì Taylor là diễn viên lồng tiếng cho nhiều bộ phim như Princess Peach, Toad, hay Toadette trong các game Mario, tuy nhiên thành công lớn nhất của Taylor đó chính là lồng tiếng cho Cortana trong game Halo. Chính vì điều này, đối với các fan hâm mộ của series game Halo, việc lấy giọng của Jen Taylor làm giọng của Cortana trên Windows Phone thực sự là một cú hích lớn. "Cô ấy sẽ đóng một phần rất lớn trong cách mà chúng tôi mở ra công nghệ nhận diện giọng nói này", Ash giải thích. Ban đầu, Taylor sẽ chỉ được sử dụng trong một số trường hợp nhất định, mà Microsoft gọi là phản hồi "chit chat", các truy vấn mà công ty có thể sử dụng các âm thanh gốc. Nếu bạn hỏi "Điều gì xảy ra với Master Chief", hoặc bất cứ thứ gì liên quan đến Covenant (một nhân vật trong Halo), thì bạn sẽ nhận được lời phản hồi có giọng nói của Taylor. Còn những phản ứng khác, hệ thống sẽ sử dụng một giọng nói tổng hợp - tương tự như giọng của Taylor. (Nếu bạn muốn Cortana đưa ra một vài thông tin vui vẻ liên quan đến Halo, bạn chỉ cần đặt nickname của bạn là "Master Chief" trong phần settings).

4. Quá trình hình thành nên Cortana: Sự kết hợp giữa Bing và Cortana

Có một thực tế là Microsoft đã không thần thánh đến mức phát triển nên một trợ lý ảo chỉ trong vòng 2 năm - được biết, công ty đã phải tận dụng các khoản đầu tư trong việc thu thập dữ liệu, công việc mà Microsoft đã thực hiện trong vòng nửa thập kỷ. Nếu như các bạn không rõ thì phần lớn các tính năng của Cortana dựa vào những dịch vụ đầu cuối của Bing, và các dữ liệu từ Cortana sẽ được thu thập, sao lưu, hỗ trợ, xử lý bởi hàng ngàn server.

Chính vì mối quan hệ mật thiết giữa Cortana và Bing, đội ngũ Windows Phone của Microsoft luôn làm việc với các kỹ sư từ Bing - điều tương tự với Google: khi Google Now và công cụ tìm kiếm Google luôn gắn liền với nhau. Và ở đây cũng vậy, Cortana sẽ không bao giờ tồn tại nếu thiếu Bing.

Tác giả của trang The Verge cho biết anh đã gặp rất nhiều kỹ sư của Bing đứng đằng sau sự ra đời của Cortana, và thật sự rõ ràng rằng, tất cả họ đều cảm thấy vô cùng hào hứng khi chứng kiến thành quả của mình đang được trình diễn trong hình hài của một sản phẩm duy nhất: Cortana. Trong khi Microsoft đang dần dần chuyển đổi Bing thành một nền tảng và dịch vụ, Bing từ trước đến nay vẫn luôn được xem là một công cụ tìm kiếm. Mặt khác, Cortana thì là một trường hợp điển hình thực sự. Trải qua nhiều năm về trước, các kỹ sư Bing của Microsoft đã làm việc trên rất nhiều dịch vụ, những dịch vụ đóng vai trò quan trọng trong việc hình thành nên Cortana, kể đến như những công nghệ cơ bản nhưng rất quan trọng như xử lý ngôn ngữ tự nhiên hay liên kết các vật thể ở thế giới thực đến dữ liệu web. Thế nhưng, tất cả chúng đều được xây dựng một cách vô thức, tức là được phát triển nhưng không biết là phục vụ cho một sản phẩm cụ thể nào. Có thể nói, nếu Bing là ngôi nhà, Cortana như một chiếc xe thể thao màu đỏ sáng bóng trong nhà để xe.

Cortana sẽ không bao giờ tồn tại nếu thiếu Bing...

Để kết hợp tất cả các phần nhỏ của Bing lại với nhau, Mike Calcagno, giám đốc phát triển quan hệ đối tác của Microsoft, làm việc ở mảng Bing, đã quyết định tham dự vào mảng tìm kiếm của Microsoft cách đây 18 tháng, và dự án lớn đầu tiên của ông chính là Cortana. "Một vài người cần phải kéo tất cả những dịch vụ này lại với nhau theo một cách chặt chẽ", Calcagno nói. "Những ai làm việc cho dự án Cortana đều có một con búp bê Cortana nhỏ, và họ đều đặt chúng ở văn phòng, do đó khi bạn bước đi xung quanh và thấy những con búp bê đó, bạn sẽ thấy "Oh...anh ấy ở đó, anh ấy có búp bê Cortana".

Sự liên kết giữa nhóm phát triển, giữa nhiều yếu tố khác nhau tiếp diễn trong suốt dự án Cortana. Đội ngũ Bing dành rất nhiều thời gian cá nhân với nhóm Windows Phone, và thật thú vị khi mọi sự thảo luận sơ khai (được chủ trì bởi Calcagno) về Cortana được bắt đầu ở một quán bar ở Bellevue, Washington. "Chúng tôi thực sự làm việc cùng với đội ngũ đó (ý là đội Bing). Chúng tôi đã sống cùng dự án với những chàng trai đó và cùng làm việc như một đội, và thành quả đó là phiên bản đầu tiên của Cortana". "Bạn có thể cho rằng đây là một ví dụ điển hình của triết lý "One Microsoft" mà cựu CEO Steve Ballmer đã áp dụng trước khi ông rời khỏi công ty - triết lý mà ở đó những đội ngũ làm việc cùng nhau thay vì cạnh tranh nội bộ.

Cortana là một sự thử nghiệm lớn giữa hàng loạt dịch vụ của Bing, và đó là lý do tại sao Microsoft đang đặt chữ "beta" ở tính năng này lúc mới ra mắt. Hệ thống cần phải học và hoàn thiện qua một thời gian, đặc biệt là là mảng nhận diện giọng nói, và Microsoft thì chỉ mới cho dùng Cortana ở khu vực Mỹ. Trong một vài ngày cận kề lễ ra mắt, đội ngũ phát triển thậm chí vẫn còn đang bận sửa lỗi. Giám đốc mảng phần mềm Bing, Vish Vadlamani, nhớ lại rằng ông đã trải qua rất nhiều ngày làm việc với Satory bất chấp thời gian, từ 7h sáng cho đến 11h30 tối. Và ông ấy hy vọng rằng nỗ lực của mình sẽ được đền đáp xứng đáng với sự ra mắt thành công của Cortana. "Có rất nhiều sự phấn khởi, và nhiêu sự sợ hãi", Vadlamani thừa nhận. Dành cho một số bạn chưa rõ, Satory là hệ thống tự học của Bing - "hệ thống kiến thức" xử lý hàng ngàn gigabyte dữ liệu cho Bing mỗi ngày. Satory cũng được sử dụng trong việc cung cấp dữ liệu, phục vụ cho Cortana.

"Tầm nhìn đằng sau những gì mà chúng tôi đang làm ở đây chính là trí thông minh này có thể mở rộng ra ngoài Windows Phone", giám đốc mảng Bing, ông Stefan Weitz giải thích. Thế nhưng, việc Microsoft sẽ đưa Cortana lên thiết bị, nền tảng nào nữa vẫn còn là một bí ẩn. Những ứng dụng bên thứ ba sẽ có thể tích hợp Cortana vào, cho phép người sử dụng vừa dùng vừa tương tác bằng giọng nói như, "Hulu, cho tôi xem phần cuối của Modern Family" và ứng dụng sẽ mở phần cuối của Modern Family lên, thay vì cách mà công cụ tìm kiếm bằng giọng nói của Xbox đang hoạt động. Kết hợp với khả năng đặt lịch nhắc nhở, đó là một ví dụ rõ ràng của một công cụ tìm kiếm bằng giọng nói hữu ích và mạnh mẽ.

Microsoft đã từng chứng kiến những gì mà Apple và Google đã làm được, kết hợp các ý tưởng tốt nhất của Siri và Google Now vào trong một giao diện hấp dẫn, dễ sử dụng - nhưng bây giờ, sự khó khăn thật sự đó là đưa Cortana lên mọi nơi: từ Xbox, Windows cho đến những sản phẩm khác của Microsoft. Tuy nhiên, Microsoft có vẻ như đã chuẩn bị cho những khó khăn đó, họ có hàng triệu Kinect đang được sử dụng với hệ thống microphone luôn luôn bật, hàng trăm triệu máy tính đang chạy Windows, đó là những gì mà Microsoft đã chuẩn bị, họ chuẩn bị cho một sự đổ bộ của Cortana lên mọi nền tảng trong tương lai không xa.