Google cung cấp bộ dữ liệu siêu dữ liệu miễn phí với các thuật toán AI và học máy học sâu ít chi tiết để phân loại hình ảnh nhanh chóng và hiệu quả trong TensorFlow và PyTorch

Google đã thông báo về sự sẵn có của nhiều bộ dữ liệu bao gồm các hình ảnh tự nhiên đa dạng nhưng có giới hạn. Gã khổng lồ tìm kiếm tự tin rằng dữ liệu có sẵn công khai sẽ thúc đẩy tốc độ của Học máy và Trí tuệ nhân tạo đồng thời giảm thời gian đào tạo các mô hình AI trên một lượng dữ liệu tối thiểu. Google đang gọi sáng kiến mới là 'Tập dữ liệu siêu dữ liệu miễn phí' sẽ giúp các mô hình AI 'học hỏi' trên ít dữ liệu hơn. ‘Ít ảnh chụp’ của công ty được tối ưu hóa để đảm bảo AI học các lớp mới chỉ từ một vài hình ảnh đại diện.

Hiểu được nhu cầu đào tạo nhanh các mô hình AI và Machine Learning với ít bộ dữ liệu hơn, Google đã ra mắt ‘Meta-Dataset’, một bộ sưu tập nhỏ các hình ảnh sẽ giúp giảm lượng dữ liệu cần thiết để cải thiện độ chính xác của các thuật toán. Công ty tuyên bố rằng sử dụng kỹ thuật phân loại hình ảnh ít lần chụp, các mô hình AI và ML sẽ có được những hiểu biết tương tự từ số lượng hình ảnh đại diện ít hơn rất nhiều.

Google AI công bố tập dữ liệu siêu dữ liệu: Tập dữ liệu tập hợp dữ liệu để học ít:

Học sâu dành cho AI và Học máy đã phát triển theo cấp số nhân trong một thời gian khá dài. Tuy nhiên, yêu cầu cốt lõi là sự sẵn có của dữ liệu chất lượng cao và số lượng lớn cũng vậy. Một lượng lớn dữ liệu đào tạo được chú thích thủ công thường khó mua và đôi khi cũng có thể không đáng tin cậy. Hiểu được rủi ro của các tập dữ liệu lớn, Google đã công bố sự sẵn có của một bộ sưu tập các tập dữ liệu meta.

Thông qua “Meta-Dataset: A Dataset of Dataset for Learning to Learn from Vài ví dụ” (được trình bày tại ICLR 2020), Google đã đề xuất một tiêu chuẩn quy mô lớn và đa dạng để đo lường năng lực của các mô hình phân loại hình ảnh khác nhau trong một số thực tế và thử thách -cài đặt ảnh chụp, cung cấp một khuôn khổ trong đó người ta có thể điều tra một số khía cạnh quan trọng của phân loại ảnh chụp ít lần. Về cơ bản, Google đang cung cấp 10 bộ dữ liệu về hình ảnh tự nhiên có sẵn công khai và miễn phí để sử dụng. Các tập dữ liệu này bao gồm ImageNet, CUB-200-2011, Fungi, các ký tự viết tay và hình tượng trưng. Mã là công khai và bao gồm một sổ ghi chép minh họa cách Meta-Dataset có thể được sử dụng trong TensorFlow và PyTorch.

Việc phân loại theo kiểu ít ảnh vượt ra ngoài mô hình đào tạo tiêu chuẩn và mô hình học sâu. Nó có sự tổng quát hóa cho các lớp hoàn toàn mới tại thời điểm kiểm tra. Nói cách khác, những hình ảnh được sử dụng trong quá trình thử nghiệm không được nhìn thấy trong quá trình đào tạo. Trong phân loại một vài cảnh, tập huấn luyện chứa các lớp hoàn toàn khác biệt với những lớp sẽ xuất hiện tại thời điểm thử nghiệm. Mỗi nhiệm vụ thử nghiệm chứa một bộ hỗ trợmột số hình ảnh được gắn nhãn mà từ đó mô hình có thể tìm hiểu về các lớp mới và bộ truy vấnví dụ mà mô hình sau đó được yêu cầu phân loại.

Meta-Dataset là một thành phần lớn, trong đó nghiên cứu mô hình tổng quát hóa cho các bộ dữ liệu hoàn toàn mới, từ đó không có hình ảnh của bất kỳ lớp nào được nhìn thấy trong đào tạo. Điều này bổ sung cho thách thức tổng quát hóa khó khăn đối với các lớp mới vốn có trong thiết lập học tập vài lần.

Meta-Dataset giúp học sâu cho các mô hình AI và máy học như thế nào?

Meta-Dataset đại diện cho tiêu chuẩn có tổ chức quy mô lớn nhất cho tập dữ liệu chéo, phân loại hình ảnh ít lần chụp cho đến nay. Nó cũng giới thiệu một thuật toán lấy mẫu để tạo ra các nhiệm vụ có các đặc điểm và độ khó khác nhau, bằng cách thay đổi số lượng lớp trong mỗi nhiệm vụ, số lượng ví dụ có sẵn trên mỗi lớp, giới thiệu sự mất cân bằng của lớp và, đối với một số tập dữ liệu, thay đổi mức độ giống nhau giữa các các lớp của mỗi nhiệm vụ.

Meta-Dataset thực sự đưa ra những thách thức mới đối với phân loại một vài cảnh quay. Nghiên cứu của Google vẫn còn sơ bộ và có rất nhiều cơ sở để đề cập. Tuy nhiên, gã khổng lồ tìm kiếm đã tuyên bố rằng các nhà nghiên cứu đang đạt được thành công. Một số ví dụ đáng chú ý bao gồm sử dụng điều hòa tác vụ được thiết kế thông minh, điều chỉnh siêu thông số phức tạp hơn, 'đường cơ sở siêu' kết hợp các lợi ích của đào tạo trước và học tập siêu tốc, và cuối cùng sử dụng lựa chọn tính năng để chuyên biệt hóa một đại diện chung cho từng nhiệm vụ .