Vorresti più informazioni intelligenti nella tua scatola in arrivo? Iscriviti solo alle nostre newsletter settimanali per ottenere la cosa importante per l’intelligenza artificiale aziendale, i dati e i leader della sicurezza. Iscriviti ora
Adobe Photoshop è una delle parti software più note create da oltre il 90% dei professionisti creativi del mondo. Fotografia.
Quindi la verità Nuovo modello AI open source – Editing qwen-imageIeri, i ricercatori di AI del colosso cinese di commercio elettronico Alibaba Ora può eseguire un gran numero di attività di editing di Photoshop con input di testo.È un successo notevole.
Costruito sul modello di Fondazione Qwen-Image Fondazione del parametro 20 miliardi pubblicato all’inizio di questo mese, Qwen-Image-Edit espande la potenza unica del sistema per formare un testo per formare un ampio compito normativo, da sottili modifiche all’aspetto a trasformazioni semantiche più ampie.
Basta caricare un’immagine iniziale: ho provato uno di me L’ultima conferenza di trasformazione di VentureBeat A San Francisco e poi scrivi istruzioni su ciò che si desidera cambiare e restituirà una nuova immagine con gli accordi di Qwen-Emage-Edit.
Ai Stroops sui limiti di ridimensionamento
I limiti di potenza, l’aumento dei costi dei marcatori e le inferenze ritardi rimodellano AI aziendale. Unisciti alla nostra sala privata per scoprire come sono le migliori squadre:
- Trasformare l’energia in un vantaggio strategico
- Architetto efficiente deduzione per guadagni di resa reale
- Aprire lo sblocco di un rendimento degli investimenti competitivi con sistemi AI sostenibili
Assicurati il tuo posto dove stare in futuro: https://bit.ly/4mwgngo
Introduzione Esempio di immagine:
Esempio ufficiale di uscita veloce: “Rendi l’uomo che indossa uno smoking”.

Il modello è ora disponibile su diverse piattaforme, comprese le loro Qwen Chat– Abbracciare la faccia– Modelli– Smeriglioe attraverso Interfaccia di programmazione dell’applicazione cloud Alibaba (API)Quest’ultimo che consente a qualsiasi sviluppatore o azienda di terze parti di integrare questo nuovo modello nelle proprie applicazioni e flussi di lavoro.
Ho creato i miei esempi sopra Qwen ChatVa notato che il team Openai di Openi è limitato a circa 8 lavori gratuiti (input/output) nel periodo di 12 ore prima di ripristinare le generazioni per qualsiasi utente entusiasta. Gli utenti a pagamento possono accedere a più lavoro.

Con una duplice attenzione agli input inglesi e cinesi e al significato semantico e alla lealtà visiva, il Qwen-Image-Düzenli mira a ridurre gli ostacoli alla creazione di contenuti visivi.
E considerando che il modello esiste come codice open source Con licenza Apache 2.0È sicuro scaricare, scaricare e installare aziende gratuitamente per le proprie attrezzature o nuvole/macchine virtuali, che potenzialmente consentono di risparmiare grandi costi da software speciali come Photoshop.
Come “Un ricercatore del team Qwen Junyang Lin”, un filo per capelli può rimuovere la modifica dell’immagine molto sensibile “, ha scritto.
L’annuncio del team riflette questo sentimento, non come un’estensione naturale dell’immagine Qwen, che implementa direttamente l’immagine di Qwen, ma come un’estensione naturale dell’immagine Qwen, che implementa direttamente i compiti di creare un approccio unico di codifica e doppia codifica.
La doppia codifica consente loro di proteggere lo stile e il contenuto dell’immagine originale
Qwen-image-edit, Qwen-imageAll’inizio di quest’anno, è stato introdotto come un modello su larga scala, specializzato in entrambe le immagini e creazione di testo.
Il rapporto tecnico di Qwen-Image ha sottolineato la sua capacità di gestire compiti complessi come la creazione di testo a livello di paragrafo, personaggi cinesi e inglesi e accordi multi-line con precisione.
Segnala anche a meccanismo a doppia codificaImmagini di alimentazione a Qwen2.5-VL per il controllo semantico contemporaneamente e un autoencoder variazionale (VAE) per i dettagli ricostruttivi. Questo approccio consente a regolamenti che rimangono fedeli all’aspetto sia della richiesta che dell’immagine originale.
Le stesse scelte architettoniche supportano Qwen-Images-Edit. Utilizzando la codifica binaria, il modello può essere regolato a due livelli: Accordi semantici cambiando il significato o la struttura di una scena e Visualizza le disposizioni Questo introduce o rimuove gli oggetti mantenendo il resto senza toccare.
Disposizione semantica Implica la trasformazione di oggetti che girano di 90 o 180 gradi per creare nuove proprietà intellettuali, per rivelare diverse opinioni o trasformare un Giuni in un altro stile come l’arte ispirata allo studio Ghibli. Questi accordi in genere cambiano molti pixel, ma mantengono l’identità degli oggetti sottostanti.
Al lavoro Esempio di disposizione semantica Da Shridhar Athinarayanan, un ingegnere della replica della piattaforma di applicazioni AI, ha usato l’applicazione riprodotta di Qwen o “Inferenza Için per far rivivere Manhattan per far rivivere una foto di Manhattan per apparire come un set di giocattoli.
Disposizione di aspetto Certamente si concentra sui cambiamenti locali. In questi casi, mentre alcuni oggetti vengono modificati, la maggior parte dell’immagine rimane invariata. Le dimostrazioni includono l’aggiunta di un segno che produce un riflesso nell’acqua, la rimozione di fili randagi da un ritratto e la modifica del colore di una singola lettera in un’immagine di testo.
Un buon esempio della disposizione dell’aspetto con l’accordo di Image Qwen proviene dal partner e CEO fondatore Thomas Hill. fianco a fianco su x Mostra sua moglie nell’abito da sposa sotto una cintura e una cintura coperta di graffiti:
Quando Qwen è combinato con la potenza in costruzione nella formazione di Cina e inglese, il sistema orientato alla disposizione è posizionato come strumento flessibile per i creatori che hanno bisogno di più di semplici immagini produttive.
Il controllo bilaterale sulla portata semantica e sulla fedeltà dell’aspetto significa che lo stesso strumento può soddisfare molte esigenze diverse dallo sviluppo del PI creativo a livello di produzione a livello di produzione.
Aggiunta o sollevamento del testo alle immagini
Un altro talento sorprendente Editing di testo bilingue. Qwen-eMage-Edit consente agli utenti di aggiungere testi, sollevare o modificare il testo in cinese e inglese proteggendo il carattere, le dimensioni e lo stile.
Ciò espande la reputazione del forte testo di Qwen-Image, specialmente in scenari impegnativi come i personaggi cinesi complessi.
In pratica, ciò consente la corretta disposizione di poster, segni, magliette T o arte calligrafia con piccoli dettagli di testo. Un altro esempio dalla copia di seguito.
Una dimostrazione coinvolta nella calligrafia cinese, che è stata prodotta con un processo di regolamentazione della catena di fasi.
Gli utenti possono enfatizzare le zone sbagliate, istruirle a correggerle e quindi migliorare i dettagli fino a creare i personaggi giusti. Questo approccio ripetuto mostra come il modello può essere applicato a compiti ad alto contenuto in cui è richiesta la sensibilità.
Applicazioni e utilizzo
Il team Qwen ha sottolineato una serie di potenziali pratiche:
- Design creativo ed espansione IPCome i pacchetti emoji basati sulla mascotte.
- Pubblicità e creazione di contenutidove possono essere personalizzati loghi, segni e elementi visivi ponderati dal testo.
- Avatar virtuali e arteCon trasferimento di stile che supporta rappresentazioni di personaggi uniche.
- Uso fotografico e personaleRegolazioni di sfondo, cambi di abbigliamento e sollevamento di oggetti.
- Protezione culturaleLa calligrafia classica è mostrata correggendo.
Colmando la disposizione a grana fine con trasformazioni creative più ampie, Qwen-Image-Edit fa appello ai professionisti che hanno bisogno di controllo pur rimanendo accessibili per gli esperimenti quotidiani.
Confronto e prestazioni
Secondo il team Qwen, le valutazioni nel criterio generale indicano che le offerte di immagini QWEN-Edit. Ultime prestazioni tecnologiche Disposizione delle immagini.
Questo deriva da più ampie valutazioni tecniche di Qwen-Vision, in cui il modello di base si traduce sia in attività generali di creatura delle immagini che di testo.
Sebbene le cifre di confronto di regolamentazione specifiche non siano dettagliate nella versione, l’immagine Qwen è stata in gran parte elencata in valutazioni indipendenti come l’AIrena AI, in cui i valutatori umani confrontano i risultati tra i diversi fornitori.
Prezzi API e usabilità
Dall’inizio alla fine Alibaba Cloud Model StudioGli sviluppatori possono accedere a Qwen-Image-Edit come API. Il prezzo è stato fissato a questo indirizzo $ 0,045 per fotoCon una quota gratuita 100 immagini valide per 180 giorni Dopo l’attivazione.
Servizio inizialmente Regione di SingaporeCon un limite di rapporto Cinque richieste al secondo E Due compiti simultanei per account.
Per utilizzare l’API, gli sviluppatori possono effettuare uno switch API in studio modello e chiamare il modello tramite HTTP o tramite Dashscope SDK in Python o Java.
Le immagini possono essere inviate in 512 a 4,096 pixel e dimensioni di file fino a 10 MB e nel formato di URL o Base64. Le immagini di output sono sistemate nell’area di archiviazione degli oggetti cloud Alibaba con connessioni valide per 24 ore e richiedono agli utenti di scaricare immediatamente e salvare i risultati.
Qual è il futuro per Qwen?
Qwen posiziona il layout dell’immagine come passo -to -patD riducendo gli ostacoli per la creazione di contenuti visivi. Certo, disposizione coerente in stile, rendendolo più accessibile, modello Può supportare applicazioni dagli studi di progettazione agli utenti ordinari che sviluppano progetti personali.
Il sistema indica anche una tendenza più ampia nello sviluppo dell’IA: spostarsi verso veicoli che si integrano, editing, correzione e miglioramento oltre la produzione singola per uso.
Con la flessibilità semantica e il livello di aspetto, Qwen-Images-Edit riflette questo cambiamento e fonde i poteri produttivi dei grandi modelli con l’affidabilità richiesta per la disposizione professionale.
Collegamento alla fonte