Izvucite uvide iz vizuelnih podataka na Azure-u (AI-3008): Detaljan Plan obuke
Module 1: Develop a vision-enabled generative AI application
- Use a vision-capable model in the Microsoft Foundry portal
- Develop a vision-based chat app
- Exercise – Develop a vision-enabled chat app
Module 2: Generate images with AI
- What are image-generation models?
- Explore image-generation models in Microsoft Foundry portal
- Create a client application that uses an image generation model
- Exercise – Generate images with AI
Module 3: Generate videos with Microsoft Foundry
- Deploy a video generating model
- Generate video from a prompt
- Generate video in Python
- Exercise – Generate video with Sora 2 in Microsoft Foundry
Module 4: Analyze images with Content Understanding
- What is Content Understanding?
- Analyze images with Content Understanding
- Exercise – Analyze images with Content Understanding
Module 5: Create a multimodal analysis solution with Azure Content Understanding
- What is Azure Content Understanding?
- Create a Content Understanding analyzer
- Use the Content Understanding API
- Exercise – Extract information from multimodal content
Module 6: Create an Azure Content Understanding client application
- Prepare to use the AI Content Understanding API
- Create a Content Understanding analyzer
- Analyze content
- Exercise – Develop a Content Understanding client application
Module 7: Extract data with Azure Document Intelligence
- What is Azure Document Intelligence?
- Use the Document Intelligence Studio
- Use prebuilt models
- Train and use custom models
- Exercise – Analyze documents with Document Intelligence
Module 8: Create a knowledge mining solution with Azure AI Search
- What is Azure AI Search?
- Extract data with an indexer
- Enrich extracted data with AI skills
- Search an index
- Persist extracted information in a knowledge store
- Exercise – Create a knowledge mining solution
Preporučeno predznanje
- Osnovno razumevanje razvoja softvera (logika aplikacije, API-ji, JSON formati)
- Poznavanje oblačnih okruženja (koncepti resursa, bezbednost, pristup)
- Praktično znanje podataka i dokumenata (PDF-ovi, slike, Office datoteke) i koncepata ekstrakcije/strukturiranja
- Osnovno znanje AI/ML i jezičkih modela (opšti koncepti: upiti, kontekst, granice)
- Razumevanje multimodalnih koncepata AI (tekst + slika/dokument) — prednost
- Razumevanje automatizacije i orkestracije (tokovi rada, okidači, koraci, alati)
- Osnovno znanje alata za kontrolu verzija (npr. Git) i ciklusa razvoja softvera
- Razumevanje principa implementacije i rada (testiranje, praćenje, kontinuirano poboljšanje) Iskustvo u timskoj saradnji (pregledi, deljenje koda, dokumentacija)
Multimodalna obuka za AI
Kurs AI-3008 je osmišljen da pomogne IT stručnjacima i programerima da steknu osnovne osnove za dizajniranje AI aplikacija sposobnih za analizu slika i dokumenata. Kurs naglašava upotrebu multimodalnih modela i alata zasnovanih na agentima za kombinovanje vizuelnog/dokumentalnog unosa sa jezičkim modelima, proizvodeći praktične rezultate u poslovnom kontekstu.
Kroz ključne koncepte i praktične vežbe, učesnici će otkriti konkretne obrasce za izvođenje strukturirane ekstrakcije, analize i orkestriranja tokova rada za donošenje odluka. Cilj: kreiranje pouzdanijih rešenja sposobnih da utemelje odgovore u vizuelnim i dokumentima i da transformišu nestrukturirani sadržaj u praktične uvide.
Zašto pohađati ovu obuku?
Multimodalna veštačka inteligencija i agenti transformišu način na koji organizacije koriste svoje slike i dokumente (ugovore, fakture, obrasce, izveštaje, tehničke datoteke) omogućavajući im da razumeju, izdvajaju i rasuđuju iz nestrukturiranog sadržaja. Ova obuka vas upoznaje sa osnovnim principima kombinovanja vizuelnog/dokumentalnog unosa i jezičkih modela kako bi se kreirale aplikacije sposobne da proizvedu pouzdane analize i odgovore direktno zasnovane na podacima.
Savladavanjem ovih osnova, moći ćete da ubrzate automatizaciju procesa, poboljšate kvalitet odluka i dizajnirate efikasnije tokove rada (strukturirano izdvajanje, validacija, rutiranje, sinteza i akcije), istovremeno povećavajući operativnu vrednost vašeg vizuelnog i dokumentarnog sadržaja.
Ključne veštine koje ćete steći
Razumevanje osnova multimodalne veštačke inteligencije
Razumeti kako modeli mogu da obrađuju i povezuju više modaliteta (tekst + slika + dokument) kako bi proizveli bogatije, kontekstualizovanije odgovore.Analiziranje slika i dokumenata za ekstrakciju informacija
Naučite da identifikujete i ekstrakujete ključne elemente (polja, tabele, odeljke, entitete) kako biste transformisali nestrukturirani sadržaj u strukturirane podatke.Kombinovanje vizuelnog/dokumentalnog unosa sa jezičkim modelima
Otkrijte kako da integrišete slike i dokumente u scenarije rezonovanja i generisanja (sumiranje, klasifikacija, upoređivanje, tumačenje).Implementacija tokova rada odlučivanja zasnovanih na agentima
Istražite agentske pristupe orkestraciji za lančane korake (analiza, validacija, akcija), alate za pokretanje i automatizovane odluke.Utemeljenje odgovora u podacima
Naučite praktične obrasce za zasnivanje odgovora modela na dokazima iz dokumenata/slika kako biste poboljšali pouzdanost i praćenje.Projektovanje rešenja orijentisanih na preduzeća
Primenite obrasce dizajna za višekratnu upotrebu kako biste kreirali akcione veštačke inteligencije: strukturirana ekstrakcija, analiza, rutiranje, sinteza i automatizacija.
Tehnička obuka koju vode stručnjaci
Ovu obuku vode instruktori sertifikovani za Microsoft/Azure koji kombinuju teorijski unos sa praktičnim vežbama. Učesnici će raditi na scenarijima iz stvarnog sveta kako bi naučili kako da dizajniraju veštačku inteligenciju (AI) aplikacije sposobne da koriste slike i dokumente koristeći multimodalne modele i alate vođene agentima.
Pristup je orijentisan na teren: videćete kako da strukturirate ekstrakciju informacija, povežete analizu i korake donošenja odluka i proizvedete odgovore zasnovane na vizuelnim i dokumentima, kako biste dobili pouzdanije i direktno primenljive rezultate.
Kome je namenjena ova obuka?
- Programeri koji žele da kreiraju veštačku inteligenciju (AI) aplikacije sposobne za analizu slika i dokumenata (ekstrakcija, klasifikacija, sinteza, validacija).
- IT stručnjaci i timovi za proizvode koji žele da automatizuju procese obrade dokumenata koristeći veštačku inteligenciju (tokovi donošenja odluka, rutiranje, kontrola kvaliteta).
- Inženjeri veštačke inteligencije/podataka/mašinskog učenja koji žele da integrišu multimodalne mogućnosti i pristupe zasnovane na agentima u aplikativna rešenja.
- Arhitekte i dizajneri rešenja kojima je potrebno da transformišu nestrukturirani sadržaj (PDF-ove, skeniranje, obrasce, izveštaje) u korisne informacije u celom preduzeću.
Podsticanje inovacija pomoću multimodalne veštačke inteligencije i agenata
Kurs AI-3008 vam pruža koncepte i praktične pristupe inteligentnim dizajnerskim aplikacijama sposobnim da vide, interpretiraju i rasuđuju o slikama i dokumentima. Registrujte se danas da biste iskoristili multimodalne modele i tokove rada zasnovane na agentima, ubrzali ekstrakciju informacija, automatizovali odluke i transformisali svoj vizuelni i dokumentarni sadržaj u vrednost koju možete koristiti.
Često postavljana pitanja – Obuka za AI-3008 (FAQ)
AI-3008 se fokusira na dizajn AI aplikacija sposobnih za obradu slika i dokumenata korišćenjem multimodalnih modela i alata koje organizuju agenti. Cilj je omogućiti strukturirane tokove rada za ekstrakciju, analizu i donošenje odluka na osnovu nestrukturiranog sadržaja.
Da. Obuka kombinuje ključne koncepte i vežbe za primenu konkretnih obrazaca: ekstrakcija informacija, redosled koraka analize, orkestracija alata i izrada odgovora zasnovanih na vizuelnim/dokumentarnim podacima.
Ne. Preporučuje se iskustvo u razvoju softvera i poznavanje podataka/dokumentacije. Kurs je prvenstveno namenjen pojedincima koji dizajniraju ili razvijaju aplikacije i žele da integrišu multimodalne mogućnosti veštačke inteligencije.
Na primer: obrada faktura i obrazaca, analiza dokumenata o usklađenosti, izdvajanje polja i tabela, klasifikacija, sumiranje izveštaja, automatizovana validacija i rutiranje, pomoć timovima za podršku/operacije iz dokumenata i snimaka.
Agent je orkestracioni pristup gde aplikacija može da planira korake, poziva alate (ekstrakcija, pretraga, validacija) i izvršava tok rada da bi postigla cilj (npr. analizira dokument, proveri kriterijume, donese odluku i generiše strukturirani izlaz).
Да. Видећете како да заснивате одговоре на информацијама које су заиста присутне на сликама/документима, како бисте побољшали поузданост, смањили халуцинације и добили резултате који се лакше прате.