Hình ảnh được tạo bằng AI là gì? Những phần mềm nào hỗ trợ tạo hình ảnh bằng AI?

Rate this post

Vào năm 2022, chúng ta đã chứng kiến sự ra đời của một số trình tạo chuyển văn bản thành hình ảnh đáng kinh ngạc. Người đầu tiên tạo nên làn sóng lớn là Dall-E 2, với Stable Diffusion xuất hiện sau đó không lâu. Kể từ đó, chúng tôi đã thấy các công cụ khác cũng xuất hiện, bao gồm Midjourney, Craiyon và thậm chí cả TikTok ở một mức độ nhất định. Ngày càng có nhiều lo ngại khi nói đến các công cụ tạo hình ảnh AI, chủ yếu liên quan đến đạo đức của những công cụ đó khi chúng có thể tạo ra hình ảnh của người thật ở những địa điểm hoặc tình huống mà chúng không thực sự ở đó.

Tuy nhiên, không chỉ có vấn đề đạo đức cần xem xét. Trình tạo hình ảnh AI được đào tạo trên hàng triệu bức ảnh và đã học cách xác định đồ đạc bằng những bức ảnh thực tế hiện có do người thật tạo ra. Khi nào nó trở thành vi phạm bản quyền? Nếu AI của bạn vô tình tạo ra một hình ảnh trông rất giống với một thiết kế khác và người tạo ra hình ảnh đó tiếp tục chia sẻ nó về mặt thương mại thì ai đó có phải chịu trách nhiệm về bất kỳ thiệt hại nào không? Nếu vậy thì ai? Ai là “nghệ sĩ” trong trường hợp này?

Có rất nhiều lý do để cảnh giác với các công cụ tạo hình ảnh AI và những lo ngại về đạo đức và an toàn này chỉ mới ở bề mặt. Những công cụ này có thể được sử dụng để tạo ra những hình ảnh giả nhằm thúc đẩy một câu chuyện và chúng cũng sẽ trở nên tồi tệ hơn theo thời gian. Với khả năng đáng kinh ngạc của các công cụ tạo hình ảnh này, thật đáng sợ khi nghĩ rằng chúng sẽ sớm có khả năng làm được những gì. Tuy nhiên, nếu bạn muốn tạo ra những bức ảnh đẹp và vui vẻ thì điều đó hoàn toàn không có hại gì.

Mục Lục

Stable Diffusion

Bản gốc miễn phí

Stable Diffusion là nguồn cảm hứng đằng sau bài viết này và là một công cụ mà tôi đang sử dụng nhiều gần đây. Nó chạy cục bộ trên máy tính của bạn (vì vậy bạn không phải tranh giành tài nguyên với những người dùng khác của một số công cụ trực tuyến) và đây là một trong những công cụ mạnh nhất mà bạn hiện có thể sử dụng. Nó không chỉ cho phép bạn tinh chỉnh rất nhiều tham số mà còn có thể kiểm soát toàn bộ quá trình tạo.

Stable Diffusion gặp phải tất cả các cạm bẫy tương tự của AI, cộng thêm “mối nguy hiểm” về khả năng tiếp cận. Bất kỳ ai có máy tính đủ mạnh đều có thể thiết lập và chạy nó nhanh chóng. Với i7-12700KF, RTX 3080, RAM 32 GB và internet gigabit, tôi đã có thể sử dụng Stable Diffusion và tạo ra những hình ảnh đầu tiên của mình trong vòng một giờ.

Điều tốt nhất về Stable Diffusion là nó hoàn toàn là nguồn mở. Bạn có thể triển khai hỗ trợ cho nó trong bất kỳ dự án nào ngay hôm nay nếu muốn và hiện đã có các plugin như Alpaca mà bạn có thể sử dụng để tích hợp với Photoshop. Nó vẫn chưa hoàn hảo nhưng vẫn còn rất sớm trong quá trình phát triển các chương trình này. Bạn có thể dùng Dream Studio nếu bạn muốn, mặc dù điều đó sẽ tốn tiền và có một chút hạn chế so với việc thiết lập tại địa phương.

Hơn nữa, nếu bạn thiết lập Stable Diffusion cục bộ, sẽ có các nhánh như WebUI phân tán ổn định của AUTOMATIC1111 đi kèm với một công cụ nâng cao tích hợp có thể tăng độ phân giải cao hơn tới bốn lần. Mặc dù bạn có thể tạo hình ảnh ở độ phân giải cao hơn, nhưng việc tạo hình ảnh ở độ phân giải thấp hơn và sau đó nâng cấp hình ảnh đó thường nhanh hơn nhiều.

Craiyon

DALL-E Mini, mặc dù không liên quan đến DALL-E

Craiyon trước đây được biết đến với cái tên DALL-E Mini, mặc dù có tên như vậy nhưng nó không liên quan đến DALL-E 2. Nó được tạo ra để tái tạo kết quả của mô hình chuyển văn bản thành hình ảnh DALL-E của OpenAI. Craiyon có sẵn cho công chúng và có thể được sử dụng để tạo ra những hình ảnh đẹp một cách đáng ngạc nhiên, mặc dù hình ảnh không chính xác và chất lượng cũng không cao. Độ phân giải hình ảnh tối đa là 256×256 và cũng không có công cụ nâng cấp nào.

Craiyon hoàn toàn miễn phí sử dụng và có thể truy cập thông qua trang web của nó. Bạn có thể tạo bất kỳ hình ảnh nào thông qua bất kỳ lời nhắc nào và điều đáng chú ý duy nhất là hình ảnh có chất lượng thấp hơn và bạn sẽ phải đợi khoảng hai phút cho mỗi loạt hình ảnh được tạo. Craiyon bắt đầu như một mô hình nguồn mở nhằm tái tạo các kết quả của mô hình DALL·E ban đầu.

DALL-E 3

Người nổi tiếng nhất

DALL-E 3 là sản phẩm của phòng thí nghiệm nghiên cứu OpenAI và là công cụ tạo hình ảnh AI nổi tiếng nhất mà mọi người nghĩ đến. Người tiền nhiệm của nó đã từng bị đóng cửa với quyền truy cập hạn chế, nhưng ngày nay nó có thể được truy cập thông qua Microsoft Copilot và ChatGPT Plus. Đối với những người có thể truy cập nó, một số kết quả mà nó có thể mang lại thật đáng kinh ngạc. Ban đầu nó bị đóng cửa do lo ngại xung quanh vấn đề đạo đức và sự an toàn của một công cụ như vậy, mặc dù nó đã dần dần mở rộng theo thời gian.

Midjourney

Chuẩn bị sẵn sàng tài khoản Discord của bạn

Midjourney là một điều thú vị vì đây là một nền tảng công cộng có thể tạo hình ảnh, mặc dù bạn thực hiện việc đó thông qua máy chủ Discord. Mặc dù trước đây nó miễn phí nhưng do lạm dụng nền tảng, ngay cả mức sử dụng thấp nhất hiện cũng phải trả phí, bắt đầu từ 10 đô la một tháng. Đó là một rào cản khá cao để gia nhập khi các tùy chọn khác miễn phí, như chạy Stable Diffusion cục bộ hoặc sử dụng Microsoft Copilot.

Để bạn biết Midjourney mạnh mẽ như thế nào, một người dùng dịch vụ, Jason Allen, đã tạo ra một tác phẩm mà anh ấy đặt tên là “Théâtre D’opéra Spatial”. Anh ấy đã tham gia cuộc thi nghệ thuật Hội chợ bang Colorado…và thắng.

QM Tech là cửa hàng chuyên cung cấp đồ Gaming Gear, linh kiện PC chất lượng cao, giá rẻ từ các hãng lớn trên toàn thế giới.

Ngoài ra, bạn có thể tham khảo các phương tiện media khác của QMTech

Youtube: Voi review

Tiktok: Vinh Vunvo