Microsoft Word, Outlook và PowerPoint để có được công cụ tạo phụ đề hình ảnh tự động được hỗ trợ bởi AI được đào tạo trên tập dữ liệu lớn sau dịch vụ Azure
Microsoft đã xác nhận rằng họ đã phát triển một hệ thống tạo phụ đề hình ảnh thông minh và mạnh mẽ. Hệ thống được hỗ trợ bởi AI có thể nhanh chóng và tự động tạo ra các cation liên quan của hình ảnh. Hệ thống có thể không trôi chảy hoặc sáng tạo như con người tạo chú thích cho hình ảnh, nhưng theo báo cáo, hệ thống này đã được đào tạo về bộ dữ liệu khổng lồ để cải thiện mức độ liên quan và độ chính xác. Microsoft đảm bảo hệ thống này mạnh gấp đôi so với hệ thống phổ biến đang được sử dụng trong các dịch vụ của công ty.
Microsoft có một hệ thống tự động tạo phụ đề mới cho hình ảnh. Hệ thống sẽ khởi chạy đầu tiên trong Dịch vụ nhận thức Azure. Tuy nhiên, Microsoft đã chỉ ra rằng điều tương tự sẽ giảm xuống Microsoft Word, Outlook và PowerPoint.
Hệ thống chú thích hình ảnh AI-Drive mới hoạt động như thế nào?
Bất kỳ hệ thống điều khiển AI nào cũng phải được đào tạo trước về các bộ dữ liệu có liên quan. Các thuật toán này học hỏi từ các điểm dữ liệu và sau đó đạt được khả năng bắt chước các mẫu hành vi mong đợi. Theo báo cáo, hệ thống tạo phụ đề hình ảnh tự động mới của Microsoft cũng được đào tạo với một tập dữ liệu khổng lồ về hình ảnh được ghép nối với các thẻ từ. Các thẻ từ này được ánh xạ tới một đối tượng riêng biệt trong một hình ảnh.
Sau khóa đào tạo ban đầu, các nhà nghiên cứu đã tinh chỉnh mô hình được đào tạo trước để tạo phụ đề trên tập dữ liệu hình ảnh đã có chú thích. Quá trình đào tạo và tinh chỉnh cho phép mô hình AI học cách soạn một câu dễ hiểu. Mô hình AI mới sau đó sử dụng vốn từ vựng trực quan để tự tạo phụ đề cho hình ảnh có chứa các đối tượng mới lạ hoặc riêng biệt một cách chính xác. Có vẻ như sự nhấn mạnh là vào đối tượng cụ thể hoặc duy nhất trong hình ảnh.
Như với tất cả các Mô hình AI, ngay cả hệ thống tạo phụ đề hình ảnh của Microsoft cũng không chính xác hoặc hoàn hảo 100 phần trăm. Tuy nhiên, Microsoft đảm bảo rằng Mô hình AI mới tốt hơn gấp đôi so với mô hình phụ đề hình ảnh hiện đang được sử dụng trong các sản phẩm và dịch vụ của công ty. Thử nghiệm nội bộ cho thấy mô hình mới có thể tạo phụ đề mô tả và chính xác hơn so với phụ đề do con người viết thủ công, Xuedong Huang, một thành viên kỹ thuật của Microsoft và giám đốc công nghệ của Azure AI Cognitive Services ở Redmond, Washington, tuyên bố.
“Chúng tôi đang đưa bước đột phá về AI này vào Azure như một nền tảng để phục vụ nhiều đối tượng khách hàng hơn. Nó không chỉ là một bước đột phá trong nghiên cứu; thời gian để biến bước đột phá đó thành sản xuất trên Azure cũng là một bước đột phá. ”
Điều mà Huang chỉ ra là Microsoft đã có thể tăng tốc đáng kể việc phát triển, cải tiến và triển khai các Mô hình AI có thể cạnh tranh với nội dung do con người tạo ra. Tuy nhiên, điều quan trọng cần lưu ý là các mô hình này thường tuân theo một bộ hướng dẫn cụ thể và phụ thuộc nhiều vào bộ dữ liệu.
Microsoft đã làm việc chăm chỉ trong vài năm qua để truyền sức mạnh của AI trên một số sản phẩm và dịch vụ của mình. AI nắm giữ sức mạnh để tăng năng suất trong khi giải phóng con người làm nhiều nhiệm vụ sáng tạo hơn. Điều thú vị là Microsoft nhằm mục đích giúp tất cả người dùng truy cập nội dung quan trọng trong bất kỳ hình ảnh nào dành cho những người bị suy giảm thị lực thông qua hệ thống phụ đề hình ảnh tự động mới.