Openai tiết lộ Dall-e 3, một trình tạo hình ảnh dựa trên Chatgpt, Dall-e 3: Fusion giữa Chatgpt và thế hệ hình ảnh sẽ làm rung chuyển Midjourney
Dall-e 3: Sự hợp nhất giữa Chatgpt và thế hệ hình ảnh sẽ làm rung chuyển Midjourney
Bằng cách tích hợp Dall-E tại Chatgpt, Openai củng cố vị trí là người dẫn đầu trong thế giới AI thế hệ. Chatgpt và Dall-e 3, cùng nhau, hứa sẽ đẩy lùi biên giới của AI.
Openai tiết lộ Dall-e 3, một trình tạo hình ảnh dựa trên Chatgpt
Phiên bản mới nhất của mô hình dựa trên GPT để tạo điều kiện cho việc tạo ra các hình ảnh phức tạp và mạch lạc.
Openai, công ty đằng sau Essential GPT, vừa tiết lộ mô hình tổng quát mới nhất của mình cho đến nay. Và lần này, nó lại là hình ảnh trong ánh đèn sân khấu; Quân đội của Sam Altman đã tiết lộ phiên bản thứ ba của máy phát điện hình ảnh Dall-e. Ông hứa hẹn nhiều sắc thái, chi tiết và sự phức tạp hơn.
Điểm đầu tiên được Openai nhấn mạnh là độ chính xác của lời nhắc. Ngay cả những máy phát điện tốt nhất hiện tại, chẳng hạn như Midjourney hay Dreamstudio, bị một vấn đề phổ biến: họ có xu hướng bỏ qua một số từ của yêu cầu văn bản.
Để có được kết quả tốt nhất, do đó, nó là cần thiết Học theo kinh nghiệm để giao tiếp với thuật toán. Điều này ngụ ý thực hiện nhiều bài kiểm tra về từ vựng và quay để tìm những người có khả năng được giải thích chính xác. Đây là một bài tập có thể tinh tế khi người dùng chờ kết quả rất cụ thể, do đó thuật ngữ ” Kỹ thuật nhanh chóng »».
Chatsgpt được huy động cho thành phần của lời nhắc
Với Dall-e 3, Openai muốn chấm dứt tình trạng này. “” Các hệ thống văn bản-hình ảnh hiện đại có xu hướng bỏ qua các từ hoặc mô tả, tạo thành người dùng để tìm hiểu lời nhắc khởi động. Dall-e 3 đại diện cho một bước tiến lớn trong khả năng tạo hình ảnh tuân thủ chính xác với văn bản được cung cấp “Cho biết công ty.
Và để làm điều này, công ty đã có công cụ hoàn hảo: Chatgpt. Phiên bản mới của mô hình khuếch tán 3 là ” Được xây dựng tự nhiên »Xung quanh chatbot. Nó hiện đang phục vụ như một trung gian cho Giải thích từng chi tiết của yêu cầu. Mô hình ngôn ngữ cũng có thể giúp người dùng tạo lời nhắc cực kỳ chi tiết để Dall-e hiểu chính xác những gì được mong đợi ở anh ấy mà không cần sử dụng các kỹ thuật Kỹ thuật nhanh chóng trình độ cao.
Và nếu kết quả ban đầu không phù hợp, thì nó không. Nó là đủ để đi một lần nữa bởi Chatgpt để yêu cầu những thay đổi chính xác về màu sắc, hình dạng, phong cách, một chi tiết cụ thể … Nói cách khác, Openai đã đặt các món ăn nhỏ vào Mức độ kiểm soát tối đa với Tối thiểu nỗ lực và chuyên môn kỹ thuật.
Trên các ví dụ được đề xuất bởi Openai, cũng lưu ý rằng Dall-E 3 có thể tạo các văn bản mạch lạc. Đây là điều mà các trình tạo hình ảnh gặp rất nhiều rắc rối khi làm cho đến nay. Ví dụ: phiên bản mới nhất của Midjourney luôn tạo ra đủ … kết quả kỳ lạ khi được yêu cầu tham gia vào bài tập này.
Bảo vệ các số liệu công cộng
Công ty vẫn áp đặt một số giới hạn cho phiên bản thứ ba này. Ví dụ, các kỹ sư đã hợp nhất các biện pháp bảo vệ đã có mặt trên Dall-E và Dall-E 2, điều này ngăn người dùng tạo nội dung ” bạo lực, người lớn hoặc đáng ghét »».
Ngoài ra, Dall-E 3 được thiết kế để từ chối các yêu cầu đề cập rõ ràng. Mục tiêu là để ngăn chặn nó được sử dụng cho mục đích tuyên truyền hoặc thông tin.
Tôn trọng sở hữu trí tuệ
Điểm quan trọng khác của bản cập nhật này là Optai dường như đã lưu ý đến nhiều lời chỉ trích đã được gửi đến các trình tạo hình ảnh khác nhau về sở hữu trí tuệ. Dall-e đi Từ chối các yêu cầu yêu cầu anh ta bắt chước phong cách của một nghệ sĩ sống. Điều này sẽ đóng cánh cửa cho nhiều nỗ lực giả mạo.
Mặt khác, hệ thống bảo vệ này chắc chắn sẽ không hoàn hảo. Độ chính xác của phiên bản thứ ba này là một thanh kiếm đôi. Về lý thuyết, một người dùng đủ nhận thức luôn có thể có được kết quả khá gần. Bạn sẽ phải có thể mô tả phong cách của nghệ sĩ được nhắm mục tiêu rất chính xác mà không cần tên rõ ràng.
Openai cũng cung cấp hai giải pháp cho phép một nghệ sĩ của từ chối rằng công việc của anh ấy được sử dụng để đào tạo Dall-e. Đầu tiên là điền vào biểu mẫu tại địa chỉ này. Nhưng nếu bạn đang tìm cách bảo vệ một số lượng lớn, như những người bạn giữ trên danh mục đầu tư trực tuyến của mình, lý tưởng là cấm truy cập vào trình thu thập thông tin GPTBOT. Để làm điều này, chỉ cần làm theo các hướng dẫn có sẵn tại địa chỉ này.
Điều này sẽ hạn chế đáng kể khả năng của Dall-e 3 để bắt chước các tác phẩm được đề cập. Ít nhất, nếu chúng chưa được chuyển đến guồng. Và thật không may là không thể xác định trong thực tế, vì dữ liệu nguồn không được giữ sau khi được tích hợp vào mô hình.
Dall-e3 sẽ chính thức ra mắt vào tháng 10 tới cho khách hàng của TATGPT Plus và Tatgpt Enterprise cung cấp.
Dall-e 3: Sự hợp nhất giữa Chatgpt và thế hệ hình ảnh sẽ làm rung chuyển Midjourney
Openai, công ty mẹ của mẹ, không còn được trình bày. Sau khi cung cấp cho chúng tôi Chatgpt, giờ đây cô ấy thông báo khả năng tạo ra hình ảnh chính xác của sau này, nhờ sự hợp nhất của Dall-E và Chatgpt trong.
Frandroid, Đối với những người theo dõi, sử dụng một công cụ tạo hình ảnh: Midjourney. Nếu nhạc cụ này hóa ra là mạnh mẽ và sáng tạo trong thế giới tạo hình ảnh, thì Dall-e của Openai cũng đang trên đường đua, với một khóa học ấn tượng không kém. Và opus mới Dall-e 3 Rủi ro tốt để thay đổi tình hình.
Theo các cuộc biểu tình được chia sẻ bởi Openai, rõ ràng là Dall-e 3 được phân biệt với những người tiền nhiệm và đối thủ cạnh tranh của nó. Khi Midjourney vượt trội trong việc phục hồi quang học, nhưng vẫn đòi hỏi nhiều thao tác, Dall-E 3 hứa hẹn một sự tạo ra hình ảnh hiệu quả hơn và ít sai lầm hơn nhiều. Một kỳ tích đáng chú ý, đặc biệt là xem xét thực tế rằng đây là một tiến bộ lớn so với Dall-e.
Ngoài ra, công cụ mới này dường như đã phát triển một năng lực cụ thể để quản lý văn bản trong hình ảnh, vượt qua khả năng của một số đối thủ cạnh tranh như khuếch tán ổn định XL và DeepFloyd. Cụ thể, Openai nhấn mạnh khả năng tạo ra những hình ảnh thuyết phục về các chữ cái, hình và thậm chí cả bàn tay con người (một khó khăn thực sự cho các công cụ này).
Dall-e 3 // Nguồn: Openai
Dall-e 3 // Nguồn: Openai
Dall-e 3 // Nguồn: Openai
Dall-e 3 // Nguồn: Openai
Dall-e 3 // Nguồn: Openai
Dall-e 3 // Nguồn: Openai
Dall-e 3 // Nguồn: Openai
Dall-e 3 // Nguồn: Openai
Bằng cách tích hợp Dall-E tại Chatgpt, Openai củng cố vị trí là người dẫn đầu trong thế giới AI thế hệ. Chatgpt và Dall-e 3, cùng nhau, hứa sẽ đẩy lùi biên giới của AI.
Chatbots sẽ không chỉ có thể trò chuyện theo cách gần như con người mà còn để tưởng tượng và tạo hình ảnh từ các mô tả đơn giản. Chúng tôi không thể chờ đợi để kiểm tra.
Nếu bạn muốn kiểm tra Dall-e 3, nó sẽ có sẵn cho Chatgpt Plus và người dùng Enterprise. Sử dụng dễ dàng hơn nhiều so với midjourney … nơi bạn cần một khách hàng bất hòa.
Những hình ảnh được tạo ra cho ai ?
Câu hỏi về bản quyền được liên kết với các hình ảnh được tạo bởi AI hiện là một chủ đề nóng. Các quy định hiện hành cho thấy hình ảnh IA đang đi vào miền công cộng. Tuy nhiên, Openai tuyên bố rõ ràng rằng tài sản của các hình ảnh được tạo ra bởi Dall-E 3 trở lại cho người tạo của họ. Và đó là một cuộc tranh luận khác trong lĩnh vực.
Bing Cat cũng được hưởng Dall-e 3
Thứ Năm, ngày 21 tháng 9 này, Microsoft đã tổ chức một hội nghị để công bố sự xuất hiện tiếp theo của Copilot, nhưng cũng có phạm vi bề mặt mới. Song song, công ty đã liên lạc với sự xuất hiện của mô hình Dall-E 3 trong Bing Image Creator. Một lời nhắc nhở, đây là công cụ tạo hình ảnh trò chuyện bing. Theo Microsoft, Bing Image Creator ” Cũng hiểu những gì bạn đang yêu cầu, cho phép bạn có được hình ảnh chính xác hơn. »»
Microsoft cũng nói đi xa hơn bằng cách thêm ” Một hình mờ kỹ thuật số vô hình đối với tất cả các hình ảnh được tạo ra bởi AI trong Bing, bao gồm cả thời gian và ngày sáng tạo của chúng. “Khó biết hình mờ này sẽ mạnh đến mức nào, cũng như chúng ta có thể kiểm tra sự hiện diện của nó hay không, nhưng đây là bước đầu tiên.
Để theo dõi chúng tôi, chúng tôi mời bạn tải xuống ứng dụng Android và iOS của chúng tôi. Bạn có thể đọc các bài viết, tệp của chúng tôi và xem video YouTube mới nhất của chúng tôi.