Rewolucja w edycji obrazu: Apple pracuje nad AI sterowaną komendami [WIDEO]
2024-02-18 16:32:49Czy istnieje możliwość, że tradycyjne klikanie myszką w celu edycji obrazu stanie się przeszłością? Projekt opracowany przez Apple i Uniwersytet Kalifornijski wydaje się sugerować, że jest to bardzo realna perspektywa. Nowa forma interakcji oparta na komendach może zrewolucjonizować sposób, w jaki pracujemy z obrazami.
Od Science-Fiction do rzeczywistości
Obrazy z lat 70. i 80. z filmów science-fiction zwykle wydają się być jedynie wytworem wyobraźni twórców. Niemniej jednak, projekt MGIE (MLLM-Guided Image Editing) stworzony przez Apple i Uniwersytet Kalifornijski przybliża nas do wizji przyszłości, w której edycja obrazu staje się procesem opartym na interakcjach językowych, a nie klikaniu myszką.
MGIE: Nowa era w edycji obrazów
MGIE to model językowy oparty na sieciach neuronowych, mający za zadanie edytować obrazy na podstawie precyzyjnych komend użytkownika. W przeciwieństwie do innych rozwiązań AI, MGIE koncentruje się na zrozumieniu intencji użytkownika, nie ograniczając się jedynie do konkretnych celów.
"Rozmowa" z programem
Wyobraź sobie, że komunikujesz się z programem, a on samodzielnie przeprowadza proces obróbki zdjęcia, rozumiejąc nawet abstrakcyjne polecenia. Przykładem może być polecenie "make it more healthy," które w rezultacie dodaje warzywa i przyprawy do obrazka pizzy. MGIE ma potencjał dokonywania zarówno globalnych, jak i lokalnych edycji, obejmujących konkretne obszary czy nawet pojedyncze piksele.
Jeśli MGIE zostałby zaimplementowany w nowoczesnej aplikacji, mógłby zrewolucjonizować sposób, w jaki podchodzimy do edycji obrazów. To nie tylko kwestia porzucenia myszki, ale i nauki zupełnie nowego sposobu interakcji z komputerem.
Komputerowe okulary XR a przyszłość edycji
Z niedawnym debiutem gogli Apple Vision Pro, firma ta pokazała, jak może wyglądać przyszłość komputerów. Za kilka lat komputerowe okulary XR mogą stać się naszym podstawowym interfejsem cyfrowym, gdzie gesty i komendy głosowe zastąpią tradycyjne metody obsługi. W takim kontekście MGIE mógłby oferować nie tylko wygodę, ale także efektywność w porównaniu do tradycyjnych rozwiązań edycji obrazów.
Choć MGIE jest jeszcze w fazie eksperymentalnej, udostępniony projekt open-source na GitHubie daje nadzieję na przyszły rozwój. Pomimo obecnych niedoskonałości, takich jak błędne analizowanie poleceń, perspektywy dla MGIE są obiecujące.
Podsumowanie
Projekt MGIE wprowadza fascynującą perspektywę nowoczesnej edycji obrazu, gdzie komendy zastępują tradycyjne klikanie myszką. Choć jeszcze musimy poczekać na perfekcyjne wdrożenie, MGIE może być kluczowym krokiem w kierunku przyszłościowej, bardziej intuicyjnej i efektywnej edycji grafiki.
Wszelkie informacje dotyczące MGIE są dostępne na stronie projektu na platformie GitHub. Dodatkowo, istnieje możliwość interaktywnego eksperymentowania z systemem online, odwiedzając witrynę huggingface.co.
ip
Fot: Krzysztof Zatycki