Google nói về tầm quan trọng của nguồn mở và dữ liệu mở trong một bài đăng trên blog gần đây
Google với tư cách là một công ty luôn ủng hộ phần mềm và dữ liệu nguồn mở, ít nhất là theo quan điểm của họ. Đó gần như là một xu hướng với các công ty lớn hiện nay khi cả Google và Microsoft đều có những đóng góp nổi bật cho bối cảnh nguồn mở. “Google cũng là một nhà đóng góp lớn cho phần mềm nguồn mở. Các ví dụ chính về điều này bao gồm Android, hệ điều hành điện thoại thông minh của chúng tôi, Chromium, cơ sở mã cho trình duyệt Chrome của chúng tôi (hiện cũng cung cấp năng lượng cho nhiều đối thủ cạnh tranh) và TensorFlow, hệ thống máy học của chúng tôi. Việc Google phát hành Kubernetes đã thay đổi dịch vụ lưu trữ đám mây mãi mãi và đã tạo điều kiện cho sự đổi mới và cạnh tranh trong ngành công nghiệp đám mây. Google cũng là nhà cung cấp mã nguồn mở lớn nhất cho GitHub, một kho lưu trữ dùng chung để phát triển phần mềm. Trong năm 2017, nhân viên của Google đã thực hiện hơn 250.000 thay đổi đối với hàng chục nghìn dự án chỉ riêng trên GitHub.”
Trong hầu hết các trường hợp, điều đó không thực sự xuất phát từ sự hào phóng mà là lợi ích từ việc phát triển miễn phí và sau đó thu lợi nhuận từ việc áp dụng rộng rãi. Dù vậy, những đóng góp này đã giúp ích cho hàng nghìn nhà nghiên cứu và đã dẫn đầu việc phát triển phần mềm một cách thống nhất, điều này cần được tôn vinh. Google trong một bài đăng blog gần đây đã nêu bật đóng góp của họ cho dữ liệu mở và phần mềm nguồn mở.
Với sự ra đời của tính năng theo dõi thời gian thực và sự phát triển của ô tô không người lái, rất nhiều nghiên cứu đang được thực hiện trong thị giác máy tính và Google là một trong những công ty đi đầu trong Visual Tech.
Google cũng đang xem xét rất nhiều dữ liệu có thể giúp nghiên cứu NLP và giúp máy tính hiểu rõ hơn lời nói của con người. Trong bài đăng trên blog, Google đã nhấn mạnh việc chia sẻ cơ sở dữ liệu quan trọng nêu rõ “Về xử lý ngôn ngữ, chúng tôi đã chia sẻ cơ sở dữ liệu Câu hỏi tự nhiên, chứa 307.373 câu hỏi và câu trả lời do con người tạo ra. Chúng tôi cũng đã cung cấp Trillion Word Corpus, dựa trên các từ được sử dụng trên các trang web công cộng và Ngram Viewer, có thể được sử dụng để khám phá hơn 25 triệu cuốn sách trong Google Sách. Những bộ sưu tập này có thể được sử dụng để dịch máy thống kê, nhận dạng giọng nói, sửa lỗi chính tả, phát hiện thực thể, trích xuất thông tin và nghiên cứu ngôn ngữ khác ”.
Công cụ tìm kiếm là một trong những hoạt động kinh doanh cốt lõi của Google, nhận được hơn 63.000 truy vấn mỗi giây. Dữ liệu này rất quan trọng đối với công ty và Google phân tích dữ liệu này cho quảng cáo được nhắm mục tiêu. Tuy nhiên, một số thông tin chi tiết về dữ liệu tổng thể được công khai trong cổng xu hướng của Google.
“Google cũng cung cấp Google Xu hướng, một dịch vụ miễn phí cho phép bất kỳ ai cũng có thể xem và tải xuống hoạt động tìm kiếm tổng hợp kể từ năm 2004 cho Tìm kiếm của Google, Tìm kiếm hình ảnh, Tìm kiếm tin tức, Mua sắm và YouTube. Bạn có thể nhận thông tin tìm kiếm cho các quốc gia, khu vực, khu vực thành phố lớn và thành phố hàng tháng, hàng tuần, hàng ngày và thậm chí hàng giờ. Dữ liệu Xu hướng được sử dụng rộng rãi bởi các nhà nghiên cứu trong các lĩnh vực đa dạng như y học và kinh tế. Theo Google Scholar, có hơn 21.000 bài nghiên cứu trích dẫn Xu hướng như một nguồn dữ liệu ”.
Tại sao lại làm việc trên các dự án mã nguồn mở?
Tôi đã nói về điều này một cách ngắn gọn ở đầu bài viết. Một phần mềm mới có thể triển khai một ý tưởng tuyệt vời và đổi mới không gian nhưng điều đó không ngăn được những người khác triển khai các ý tưởng tương tự và sau đó làm việc để cải thiện nó. Nhiều công ty đã học nó một cách khó khăn, ví dụ như Windows Phone. Như chúng ta biết đó là một thất bại vang dội và vì nhiều lý do nhưng việc có một môi trường khép kín và kiểm soát việc cấp phép là một phần quan trọng của nó. Hardoop và HDFS là các phiên bản mã nguồn mở của MapReduce do Google xây dựng và công ty đã sớm nhận ra tầm quan trọng của mã nguồn mở. Tóm lại, quyết định tạo một mã nguồn mở IP là một quyết định mang tính chiến lược.
Google trong bài đăng trên blog của mình đi sâu vào một vài lý do khác, nêu rõ “Đầu tiên và quan trọng nhất, nhiệm vụ chính của chúng tôi là “sắp xếp thông tin của thế giới và làm cho thông tin hữu ích và có thể truy cập được trên toàn cầu”. Chắc chắn một cách rõ ràng để làm cho thông tin hữu ích và có thể truy cập được trên toàn cầu là cho đi!”
Họ cũng nói về lý do tại sao họ không thể phát hành một số nội dung nêu rõ “Tất nhiên, chúng tôi không thể phát hành tất cả dữ liệu chúng tôi sử dụng trong công việc kinh doanh của mình. Chúng tôi cần bảo vệ quyền riêng tư của người dùng, duy trì tính bảo mật cho khách hàng doanh nghiệp và bảo vệ tài sản trí tuệ của chính Google. Tuy nhiên, tùy thuộc vào những cân nhắc như vậy, chúng tôi thường cố gắng làm cho dữ liệu của mình “có thể truy cập toàn cầu và hữu ích” nhất có thể.“