Whisk: Hình dung và phối lại ý tưởng bằng hình ảnh và AI

Admin / December 17, 2024

Hôm nay tại Mỹ, Google ra mắt thử nghiệm mới nhất về AI tạo sinh: Whisk. Thay vì tạo hình ảnh bằng những lời nhắc văn bản dài dòng và chi tiết, Whisk cho phép bạn sử dụng hình ảnh làm lời nhắc. Chỉ cần kéo hình ảnh vào và bắt đầu sáng tạo.
Whisk cho phép bạn nhập hình ảnh cho chủ thể, một hình ảnh cho cảnh và một hình ảnh khác cho phong cách. Sau đó, bạn có thể phối lại chúng để tạo ra thứ gì đó độc đáo của riêng mình, từ thú nhồi bông kỹ thuật số đến ghim hoặc nhãn dán tráng men.



Ví dụ về hình ảnh được tạo bằng Whisk - cá kỳ ảo

Đằng sau hậu trường, mô hình Gemini tự động viết chú thích chi tiết cho hình ảnh của bạn. Sau đó, nó đưa những mô tả đó vào mô hình tạo ảnh mới nhất của Google, Imagen 3. Quá trình này nắm bắt bản chất của chủ thể chứ không phải là bản sao chính xác. Bằng cách đó, bạn có thể dễ dàng phối lại chủ thể, cảnh và phong cách của mình theo những cách mới lạ.

Vì Whisk chỉ trích xuất một vài đặc điểm chính từ hình ảnh của bạn, nên nó có thể tạo ra những hình ảnh khác với mong đợi của bạn. Ví dụ: chủ thể được tạo có thể có chiều cao, cân nặng, kiểu tóc hoặc màu da khác nhau. Google hiểu rằng những đặc điểm này có thể rất quan trọng đối với dự án của bạn và Whisk có thể bỏ lỡ điểm mấu chốt, vì vậy Google cho phép bạn xem và chỉnh sửa các lời nhắc cơ bản bất kỳ lúc nào.
rong quá trình thử nghiệm ban đầu với các nghệ sĩ và nhà sáng tạo, mọi người đã mô tả Whisk như một loại công cụ sáng tạo mới — không phải là trình chỉnh sửa ảnh truyền thống. Nó được xây dựng để khám phá hình ảnh nhanh chóng, không phải chỉnh sửa từng pixel hoàn hảo. Whisk hướng đến việc khám phá ý tưởng theo những cách mới mẻ và sáng tạo, cho phép bạn làm việc với hàng tá tùy chọn và tải xuống những tùy chọn bạn yêu thích.