Gemini 3.5 Flash, Omni i Spark – co nowego i jak wdrożyć
Gemini 3.5 Flash, Omni i Spark dostępne od 19 maja 2026 r. Sprawdź benchmarki, ceny API w PLN i plan wdrożenia zgodny z AI Act dla polskich firm.

Od 19 maja 2026 roku Google udostępniło trzy modele ogłoszone na Google I/O 2026: Gemini 3.5 Flash (szybki model agentyczny i programistyczny), Gemini Omni Flash (multimodalna edycja wideo i treści) oraz Gemini Spark (agent działający w chmurze, zintegrowany z Google Workspace). Wszystkie są dostępne przez API oraz w aplikacji Gemini – również w Polsce, w 98 językach i blisko 200 krajach.
Gemini 3.5 Flash – parametry, benchmarki i zastosowania
Gemini 3.5 Flash to pierwszy model nowej generacji, który Google pozycjonuje jako narzędzie do wieloetapowych procesów agentycznych i zadań programistycznych. Kluczowe parametry techniczne ogłoszone podczas Google I/O 2026:
- Okno kontekstowe: 1 000 000 tokenów wejściowych, 64 000 tokenów wyjściowych.
- Przepustowość: około 280 tokenów na sekundę – według Google około czterokrotnie szybciej niż porównywalne modele frontier.
- W środowisku Antigravity (podagenci, harmonogramowanie, integracja z Workspace): nawet dwunastokrotnie szybciej niż porównywalne modele tej klasy.
Wybrane wyniki benchmarkowe podane przez Google: Terminal-Bench 2.1 – 76,2%, GDPval-AA – 1656 Elo, MCP Atlas – 83,6%, multimodalne CharXiv Reasoning – 84,2%. Wyniki te plasują Gemini 3.5 Flash powyżej Gemini 3.1 Pro w kategoriach kodu i rozumowania agentycznego.
W praktyce model sprawdza się przy automatyzacji CI/CD, weryfikacji pull requestów, tworzeniu scenariuszy testowych i obsłudze wieloetapowych workflowów. Zespoły inżynierskie korzystające z ekosystemu Antigravity raportują skrócenie cykli projektowych – dane podawane w materiałach Google mówią nawet o 50% przy konkretnych scenariuszach agentycznych.
Model dostępny jest w subskrypcji Google AI Ultra (konsumenci) oraz Gemini for Workspace (biznes). Podstawowa wersja działa też w darmowej aplikacji Gemini z limitami prędkości i kontekstu. Więcej o narzędziach developerskich znajdziesz w dziale Narzędzia AI.
Cennik API Gemini 3.5 Flash – orientacyjne stawki w PLN
Google rozlicza API w USD. Przy orientacyjnym kursie 1 USD ≈ 4,0 PLN (sprawdź aktualny kurs przed kalkulacją budżetu), przykładowe stawki API Gemini 3.5 Flash prezentują się następująco:
- Input: 1,50 USD / 1M tokenów (~6,00 PLN / 1M tokenów)
- Output: 9,00 USD / 1M tokenów (~36,00 PLN / 1M tokenów)
- Cached input: 0,15 USD / 1M tokenów (~0,60 PLN / 1M tokenów)
Dla firm planujących wdrożenie agentyczne z dużą liczbą zapytań, opcja cached input znacząco obniża koszty operacyjne przy powtarzalnych promptach systemowych. Oficjalne, aktualne stawki dostępne są w oficjalnym blogu Google (PL).
Gemini Omni Flash – multimodalna edycja wideo i treści
Gemini Omni to według Google „world model" – silnik integrujący modele językowe z generatywnymi modelami mediów (Veo, inne). Pierwszym modelem z tej rodziny dostępnym szeroko jest Gemini Omni Flash.
Kluczowe możliwości Omni Flash:
- Edycja istniejącego wideo: dodawanie obiektów, zmiana tła, stylu, kąta kamery lub przebiegu wydarzeń bez utraty spójności sceny.
- Wejście multimodalne jednocześnie: tekst, grafika, wideo i dźwięk jako równoległe wejście do jednego modelu.
- Lepsze rozumienie fizyki: grawitacja, dynamika płynów, energia kinetyczna – sceny generowane przez Omni mają wyglądać naturalniej niż w poprzednich modelach wideo.
- Spójne postacie i sceny: możliwość generowania materiałów z zachowaniem identyczności postaci między ujęciami.
Dla działów marketingu i e-commerce Omni Flash otwiera dostęp do profesjonalnego generowania i edycji wideo bez oddzielnych narzędzi produkcyjnych. Google wskazuje Omni jako fundament przyszłych narzędzi wideo dla YouTube i Android XR. W kontekście AI w marketingu – integracja z istniejącymi kampaniami contentowymi staje się znacznie prostsza przy jednym wejściu multimodalnym.
Gemini Spark – agent w chmurze dla Google Workspace
Gemini Spark działa na platformie Gemini 3.5 z Antigravity i jest opisywany przez Google jako „całodobowy, osobisty agent AI". Zasadnicza różnica względem chatbota: Spark wykonuje działania, nie tylko odpowiada na pytania.
Praktyczne funkcje Sparka:
- Organizowanie skrzynki Gmail i priorytetyzacja wątków.
- Przygotowywanie materiałów na spotkania na podstawie Kalendarza Google i Dokumentów.
- Proaktywne propozycje działań na podstawie listy zadań i bieżących projektów.
- Praca w tle po zamknięciu urządzenia – agent kontynuuje zadania w chmurze.
- Personalizowanie strumienia informacji (newsy, raporty branżowe).
Spark jest głęboko zintegrowany z Google Workspace: Gmail, Dokumenty, Prezentacje, Arkusze, Kalendarz. Polskie firmy korzystające z Workspace for Business mogą aktywować Sparka bez dodatkowej infrastruktury – wystarczy odpowiedni plan subskrypcji Gemini for Workspace.
Szczegółowe porównanie planów i możliwości agentycznych znajdziesz w sekcji AI dla biznesu na AI Puls.
Plan wdrożenia krok po kroku – dla polskich firm
Poniżej praktyczny schemat wdrożenia oparty na ogłoszonych funkcjach. Każdy etap można realizować niezależnie.
Etap 1 – Szybkie zwycięstwa (do 2 tygodni)
- Aktywuj Gemini w Google Workspace (jeśli firma korzysta z Google Apps – sprawdź dostępny plan).
- Uruchom Gemini Spark do zarządzania skrzynką mailową i kalendarzem dla wybranego zespołu pilotażowego (3-5 osób).
- Przetestuj Gemini 3.5 Flash przez Google AI Studio do jednego powtarzalnego zadania programistycznego lub generowania treści.
Etap 2 – Integracja agentyczna (2-6 tygodni)
- Podłącz Gemini 3.5 Flash przez API do istniejącego pipeline'u CI/CD lub systemu zarządzania treścią.
- Skonfiguruj podagenty w środowisku Antigravity do harmonogramowania powtarzalnych zadań operacyjnych.
- Przetestuj Omni Flash do edycji materiałów wideo dla jednej kampanii marketingowej.
Etap 3 – Zgodność i skala (przed sierpniem 2026)
- Przeprowadź DPIA (Data Protection Impact Assessment) dla każdego wdrożenia przetwarzającego dane osobowe – wymóg RODO przy systemach AI.
- Sprawdź klasyfikację ryzyka wdrożonych systemów pod kątem AI Act (UE) – pełne wymagania dla systemów wysokiego ryzyka wchodzą w sierpniu 2026 r.
- Udokumentuj logikę działania agentów (Spark, Antigravity) dla wymagań przejrzystości AI Act.
- Skonfiguruj limity tokenów i alerty kosztowe w Google Cloud, by kontrolować wydatki API w PLN.
W kontekście AI Act warto zwrócić uwagę, że systemy agentyczne (jak Spark działający na danych pracowników) mogą wymagać klasyfikacji i rejestracji. Więcej o obowiązkach compliance omówiono w dziale Edukacja AI. Firmy szukające wsparcia w klasyfikacji systemów AI pod AI Act mogą skorzystać z zasobów polskiej platformy zgodności AI EU Act.
WebMCP i HTML-in-Canvas – co to oznacza dla developerów
Dwa nowe elementy techniczne ogłoszone równolegle z modelami:
WebMCP to rozszerzenie umożliwiające agentom AI dokładniejsze wykonywanie sekwencyjnych zadań w przeglądarce – z kontrolą błędów i powtarzalnością na poziomie produkcyjnym. To fundament dla automatyzacji procesów biurowych i operacji zaplecza e-commerce realizowanych przez agenty.
API HTML-in-Canvas otwiera możliwość osadzania trójwymiarowych, w pełni przeszukiwalnych doświadczeń w standardzie webowym – bez ciężkich wtyczek. Praktyczne zastosowania: interaktywne konfiguratory produktów, wirtualne showroomy, prezentacje ofertowe. Wszystko w technologii webowej dostępnej przez standardową przeglądarkę.
Dla zespołów developerskich oba elementy razem z Antigravity tworzą spójny ekosystem do budowania złożonych, agentycznych aplikacji webowych. Przegląd narzędzi developerskich z ekosystemu Google znajdziesz w katalogu Narzędzi AI.
FAQ
- Czym różni się Gemini 3.5 Flash od wcześniejszego Gemini 1.5 Flash?
- Gemini 3.5 Flash oferuje okno kontekstowe 1 000 000 tokenów, przepustowość około 280 tokenów na sekundę i znacznie lepsze wyniki w benchmarkach agentycznych (Terminal-Bench 2.1: 76,2%, MCP Atlas: 83,6%). Poprzednie generacje nie były projektowane pod wieloetapowe procesy agentyczne z integracją Antigravity.
- Czy Gemini Spark działa po polsku i jest dostępny w Polsce?
- Tak – Google deklaruje dostępność w 98 językach i blisko 200 krajach od 19 maja 2026 roku. Spark jest zintegrowany z Google Workspace, który obsługuje język polski. Polskie firmy korzystające z planów Workspace for Business mogą aktywować agenta bez dodatkowej infrastruktury.
- Ile kosztuje dostęp do Gemini 3.5 Flash przez API w przeliczeniu na PLN?
- Orientacyjne stawki to około 6 PLN za 1M tokenów wejściowych i 36 PLN za 1M tokenów wyjściowych (przy kursie 1 USD ≈ 4 PLN). Cached input obniża koszt do około 0,60 PLN / 1M tokenów. Aktualne ceny w USD należy weryfikować w Google Cloud Console przed kalkulacją budżetu.
- Jakie obowiązki compliance nakłada AI Act na wdrożenie Gemini Spark w firmie?
- Systemy agentyczne przetwarzające dane pracowników lub klientów mogą wymagać klasyfikacji ryzyka zgodnie z AI Act (pełne wymagania od sierpnia 2026 r.) oraz DPIA na podstawie RODO. Konieczna jest dokumentacja logiki działania agenta i zapewnienie przejrzystości wobec osób, których dane są przetwarzane.
- Czym jest Gemini Omni Flash i do czego służy w praktyce?
- Gemini Omni Flash to pierwszy model z rodziny Omni – przyjmuje jednocześnie tekst, grafikę, wideo i dźwięk, a następnie edytuje lub generuje materiały wideo z zachowaniem spójności sceny, postaci i fizyki. W praktyce umożliwia edycję filmów marketingowych, zmianę tła czy stylu bez odrębnych narzędzi produkcyjnych.
- Jak szybko można wdrożyć Gemini 3.5 Flash bez działu IT?
- Najprostszą ścieżką jest Google AI Studio – dostęp przez przeglądarkę bez instalacji. Testy modelu można rozpocząć tego samego dnia co rejestracja. Integracja przez API z własnymi systemami wymaga podstawowej wiedzy programistycznej i zajmuje typowo od kilku dni do kilku tygodni, zależnie od złożoności workflowu.



