AI tạo ra hình ảnh 3D chất lượng cao từ chỉ một dòng hướng dẫn

Tháng Sáu 26 15:59 2023

ISRAEL – Không có giới hạn cho sự khéo léo của trí tuệ nhân tạo AI? Giờ đây, chúng có thể tạo hình ảnh 3D độ nét cao gần như ngay lập tức, chỉ từ một câu hướng dẫn đơn giản.

3DFY tự giới hạn trong phạm vi hoặc đối tượng rất hẹp, nhưng thực hiện chúng ở tiêu chuẩn cao

Ví dụ: “Chiếc đèn ngủ hiện đại có thân bằng đá cẩm thạch hình quả trứng và chụp vải hình nón”.

Nhấn nút Generate (tạm dịch “Tạo”) và 35 giây sau bạn có hình 3D đèn của mình. Bạn muốn thay đổi màu sắc, tinh chỉnh thiết kế hoặc thay đổi hình dạng? Hãy đưa cho AI một lời nhắc khác và công việc coi như đã hoàn thành.

Vậy làm thế nào để 3DFY đạt được chất lượng cao như vậy? Ông Dahan nói: “Về cơ bản, chúng tôi đang sử dụng công nghệ khác. Chúng tôi đánh đổi chất lượng hoặc loại nội dung có thể được tạo ra.

3DFY, là một công ty khởi nghiệp của Israel. Như bạn đã biết, nhu cầu về hình ảnh 3D đang tăng theo cấp số nhân – để chơi game, bán lẻ trực tuyến, thực tế ảo và thực tế tăng cường (như Vision Pro mới của Apple ) và Metaverse.

Nhưng cho đến nay, đó là một quá trình tốn kém và tốn nhiều công sức. Việc tạo đèn ngủ có thể mất từ ​​vài giờ đến vài ngày, tùy thuộc vào độ phức tạp của nó.

Các công ty 3D ngày nay phải quét một đối tượng hiện có, sử dụng hàng trăm bức ảnh từ mọi góc độ hoặc máy quét 3D.

Công nghệ của công ty 3DFY mất 35 giây để tạo ra hình ảnh chiếc đèn ngủ hiện đại này từ một hướng dẫn đơn giản.

Ông Eliran Dahan, Giám đốc điều hành của công ty cho biết: “Chúng tôi đã phát triển một hệ thống AI mới có thể tạo ra nội dung 3D chất lượng cao, sử dụng lời nhắc bằng văn bản. Và trong tương lai gần, là cả hình ảnh nữa”.

Vì vậy, không còn nhu cầu về một đối tượng hiện có, thực tế làm điểm bắt đầu. Hình ảnh 3D có thể là thứ chỉ tồn tại trong trí tưởng tượng của bạn. (Bạn có thể dùng thử tại đây )

Sẽ không có gì ngạc nhiên khi 3DFY, một công ty khởi nghiệp nhỏ có trụ sở tại Haifa, không đơn độc trong việc sử dụng AI để biến văn bản thành hình ảnh 3D.

Công nghệ của 3DFY sẽ tạo ra hình ảnh 3D chất lượng cao từ một câu hướng dẫn duy nhất.

Công ty đối đầu với những gã khổng lồ công nghệ như OpenAI (nhà phát triển ChatGPT), Google và Nvidia (với doanh thu gần 27 tỷ đô la vào năm 2023), những công ty đang phát triển cách làm của riêng họ.

Nhưng trong khi các công ty nói trên đang theo đuổi mô hình theo chiều rộng, ông Dahan nói – về khả năng tạo ra hình ảnh 3D của bất kỳ vật thể nào trên trái đất hoặc xa hơn nữa – thì công ty 3DFY lại hướng tới chiều sâu.

Công ty tự giới hạn trong một phạm vi đối tượng rất hẹp và nghe có vẻ kỳ quặc – như đèn bàn, ghế sofa, bàn, ghế dài, dao kéo và kiếm – nhưng chúng đạt tiêu chuẩn cao đến mức đó là một đề xuất hấp dẫn cho các doanh nghiệp muốn có hình ảnh 3D của những đối tượng đó, các đối tượng cụ thể như đã nêu.

Nếu 3DFY không làm đúng ngay lần đầu tiên (Đây là yêu cầu của tôi – một ngã ba ba hướng). Bạn có thể thử lại. (Chụp màn hình)

Ông Dahan cho biết các đối thủ sản xuất một “món đồ chơi thú vị”. “Họ có thể tạo ra khá nhiều nội dung, họ có thể làm mọi thứ kỳ quặc. Nhưng bất cứ thứ gì họ sản xuất đều có chất lượng rất thấp từ quan điểm kỹ thuật, nghĩa là các mô hình 3d của chính họ, chúng không thể chỉnh sửa được, chất liệu của chúng trông rất kém.

Công ty 3DFY khuyến khích các khách hàng thử miễn phí với dịch vụ của họ để xem nó hoạt động như thế nào và chỉ trả tiền nếu họ muốn sở hữu và tải xuống hình ảnh.

“Tuy nhiên, các mô hình 3D thường rất đắt tiền, vì vậy việc sử dụng dịch vụ web của chúng tôi chỉ với vài đô la cho một mô hình là rất phải chăng”,

Nếu mô hình không chính xác như bạn mong muốn, bạn dùng có thể điều chỉnh lời nhắc văn bản – hướng dẫn họ – cho đến khi mô hình đạt được sự hoàn hảo.

Công nghệ AI hiểu cách một món đồ nội thất được tạo thành từ các bộ phận riêng biệt

“Giải pháp của chúng tôi là giới hạn danh mục, nghĩa là chúng tôi chỉ có thể tạo mô hình 3D từ các danh mục nhất định. Ví dụ: tất cả các loại danh mục nội thất, và chúng tôi có một số danh mục trò chơi, như khiên và kiếm, làm việc trên rìu, và những thứ tương tự.

“Bây giờ chúng tôi đã nắm bắt được công nghệ, chúng tôi đang ngày càng mở rộng danh mục lựa chọn.

“Tôi là người cuối cùng tuyên bố rằng tôi có thể làm những thứ mà OpenAI hay các nhà nghiên cứu của Google không thể làm được. Tuy nhiên, với công nghệ hiện tại họ đang sử dụng, tôi nghĩ rằng họ khó có thể đạt được điều này, vì vậy họ cần chuyển hướng sang công nghệ khác về cơ bản”.

Kiếm là một loại vật dụng phổ biến vì chúng được sử dụng rộng rãi trong các trò chơi.

Cả ông Dahan và ông Tal Kenig, Phó chủ tịch (phụ trách nghiên cứu và phát triển) của công ty đều có kiến ​​thức nền về hình ảnh y tế. Họ học cùng trường trung học và cả hai đều học tại Học viện Công nghệ Technion – Israel, ở Haifa.

“Cả hai chúng tôi đều là người bản địa, đã từng làm việc trong lĩnh vực chụp X quang và chụp ảnh y tế về cơ thể người. ông Dahan nói: “Chúng tôi có xu hướng suy nghĩ ở dạng 3D.

“Chúng tôi đã gặp một người quen chung trong lĩnh vực mô hình 3D và chúng tôi biết được rằng mọi thứ đều được thực hiện thủ công. Thành thật mà nói, lần đầu tiên chúng tôi đã không tin điều đó. Chúng tôi nhận ra rằng làm theo cách đó tốn rất nhiều tiền. Và chúng tôi nhận ra rằng có một nhu cầu thực sự rất cao đối với các mô hình 3D.

“Chúng tôi hiểu ngay rằng có công nghệ hiện đại có thể áp dụng cho vấn đề này. Chúng tôi bắt đầu phát triển một công nghệ AI có thể tạo ra các mô hình 3D chất lượng rất cao”.

Trọng tâm của công ty là học máy (machine learning) và đồ họa máy tính, nhưng họ nói rằng hầu hết các công ty lớn đều bỏ bê khía cạnh đồ họa.

“Những gì chúng tôi đang hướng tới là trở thành công ty sản xuất mô hình 3D lớn nhất trên thế giới. Bây giờ chúng tôi có bảy loại. Hãy nghĩ xem điều gì sẽ xảy ra khi chúng ta có 700 danh mục. Bạn sẽ tìm thấy khá nhiều mặt hàng trên toàn thế giới.

“Bạn có thể trang bị toàn bộ, từ nhà cửa hoặc môi trường với đèn đường, cây cối, nhà cửa, ô tô, giày dép, kính, bất cứ thứ gì.”

Để xem các tin bài khác về “Hình ảnh 3D”, hãy nhấn vào đây.

 

Nguồn: NoCamels

Bình luận hay chia sẻ thông tin