Przejdź do treści
AI Puls
Narzędzia AI

Gemini 3.5 Flash, Omni i Spark – co nowego i jak wdrożyć

Gemini 3.5 Flash, Omni i Spark dostępne od 19 maja 2026 r. Sprawdź benchmarki, ceny API w PLN i plan wdrożenia zgodny z AI Act dla polskich firm.

21 maja 2026
Gemini 3.5 Flash, Omni i Spark – co nowego i jak wdrożyć

Od 19 maja 2026 roku Google udostępniło trzy modele ogłoszone na Google I/O 2026: Gemini 3.5 Flash (szybki model agentyczny i programistyczny), Gemini Omni Flash (multimodalna edycja wideo i treści) oraz Gemini Spark (agent działający w chmurze, zintegrowany z Google Workspace). Wszystkie są dostępne przez API oraz w aplikacji Gemini – również w Polsce, w 98 językach i blisko 200 krajach.

Gemini 3.5 Flash – parametry, benchmarki i zastosowania

Gemini 3.5 Flash to pierwszy model nowej generacji, który Google pozycjonuje jako narzędzie do wieloetapowych procesów agentycznych i zadań programistycznych. Kluczowe parametry techniczne ogłoszone podczas Google I/O 2026:

  • Okno kontekstowe: 1 000 000 tokenów wejściowych, 64 000 tokenów wyjściowych.
  • Przepustowość: około 280 tokenów na sekundę – według Google około czterokrotnie szybciej niż porównywalne modele frontier.
  • W środowisku Antigravity (podagenci, harmonogramowanie, integracja z Workspace): nawet dwunastokrotnie szybciej niż porównywalne modele tej klasy.

Wybrane wyniki benchmarkowe podane przez Google: Terminal-Bench 2.1 – 76,2%, GDPval-AA – 1656 Elo, MCP Atlas – 83,6%, multimodalne CharXiv Reasoning – 84,2%. Wyniki te plasują Gemini 3.5 Flash powyżej Gemini 3.1 Pro w kategoriach kodu i rozumowania agentycznego.

W praktyce model sprawdza się przy automatyzacji CI/CD, weryfikacji pull requestów, tworzeniu scenariuszy testowych i obsłudze wieloetapowych workflowów. Zespoły inżynierskie korzystające z ekosystemu Antigravity raportują skrócenie cykli projektowych – dane podawane w materiałach Google mówią nawet o 50% przy konkretnych scenariuszach agentycznych.

Model dostępny jest w subskrypcji Google AI Ultra (konsumenci) oraz Gemini for Workspace (biznes). Podstawowa wersja działa też w darmowej aplikacji Gemini z limitami prędkości i kontekstu. Więcej o narzędziach developerskich znajdziesz w dziale Narzędzia AI.

Cennik API Gemini 3.5 Flash – orientacyjne stawki w PLN

Google rozlicza API w USD. Przy orientacyjnym kursie 1 USD ≈ 4,0 PLN (sprawdź aktualny kurs przed kalkulacją budżetu), przykładowe stawki API Gemini 3.5 Flash prezentują się następująco:

  • Input: 1,50 USD / 1M tokenów (~6,00 PLN / 1M tokenów)
  • Output: 9,00 USD / 1M tokenów (~36,00 PLN / 1M tokenów)
  • Cached input: 0,15 USD / 1M tokenów (~0,60 PLN / 1M tokenów)

Dla firm planujących wdrożenie agentyczne z dużą liczbą zapytań, opcja cached input znacząco obniża koszty operacyjne przy powtarzalnych promptach systemowych. Oficjalne, aktualne stawki dostępne są w oficjalnym blogu Google (PL).

Gemini Omni Flash – multimodalna edycja wideo i treści

Gemini Omni to według Google „world model" – silnik integrujący modele językowe z generatywnymi modelami mediów (Veo, inne). Pierwszym modelem z tej rodziny dostępnym szeroko jest Gemini Omni Flash.

Kluczowe możliwości Omni Flash:

  • Edycja istniejącego wideo: dodawanie obiektów, zmiana tła, stylu, kąta kamery lub przebiegu wydarzeń bez utraty spójności sceny.
  • Wejście multimodalne jednocześnie: tekst, grafika, wideo i dźwięk jako równoległe wejście do jednego modelu.
  • Lepsze rozumienie fizyki: grawitacja, dynamika płynów, energia kinetyczna – sceny generowane przez Omni mają wyglądać naturalniej niż w poprzednich modelach wideo.
  • Spójne postacie i sceny: możliwość generowania materiałów z zachowaniem identyczności postaci między ujęciami.

Dla działów marketingu i e-commerce Omni Flash otwiera dostęp do profesjonalnego generowania i edycji wideo bez oddzielnych narzędzi produkcyjnych. Google wskazuje Omni jako fundament przyszłych narzędzi wideo dla YouTube i Android XR. W kontekście AI w marketingu – integracja z istniejącymi kampaniami contentowymi staje się znacznie prostsza przy jednym wejściu multimodalnym.

Gemini Spark – agent w chmurze dla Google Workspace

Gemini Spark działa na platformie Gemini 3.5 z Antigravity i jest opisywany przez Google jako „całodobowy, osobisty agent AI". Zasadnicza różnica względem chatbota: Spark wykonuje działania, nie tylko odpowiada na pytania.

Praktyczne funkcje Sparka:

  • Organizowanie skrzynki Gmail i priorytetyzacja wątków.
  • Przygotowywanie materiałów na spotkania na podstawie Kalendarza Google i Dokumentów.
  • Proaktywne propozycje działań na podstawie listy zadań i bieżących projektów.
  • Praca w tle po zamknięciu urządzenia – agent kontynuuje zadania w chmurze.
  • Personalizowanie strumienia informacji (newsy, raporty branżowe).

Spark jest głęboko zintegrowany z Google Workspace: Gmail, Dokumenty, Prezentacje, Arkusze, Kalendarz. Polskie firmy korzystające z Workspace for Business mogą aktywować Sparka bez dodatkowej infrastruktury – wystarczy odpowiedni plan subskrypcji Gemini for Workspace.

Szczegółowe porównanie planów i możliwości agentycznych znajdziesz w sekcji AI dla biznesu na AI Puls.

Plan wdrożenia krok po kroku – dla polskich firm

Poniżej praktyczny schemat wdrożenia oparty na ogłoszonych funkcjach. Każdy etap można realizować niezależnie.

Etap 1 – Szybkie zwycięstwa (do 2 tygodni)

  1. Aktywuj Gemini w Google Workspace (jeśli firma korzysta z Google Apps – sprawdź dostępny plan).
  2. Uruchom Gemini Spark do zarządzania skrzynką mailową i kalendarzem dla wybranego zespołu pilotażowego (3-5 osób).
  3. Przetestuj Gemini 3.5 Flash przez Google AI Studio do jednego powtarzalnego zadania programistycznego lub generowania treści.

Etap 2 – Integracja agentyczna (2-6 tygodni)

  1. Podłącz Gemini 3.5 Flash przez API do istniejącego pipeline'u CI/CD lub systemu zarządzania treścią.
  2. Skonfiguruj podagenty w środowisku Antigravity do harmonogramowania powtarzalnych zadań operacyjnych.
  3. Przetestuj Omni Flash do edycji materiałów wideo dla jednej kampanii marketingowej.

Etap 3 – Zgodność i skala (przed sierpniem 2026)

  1. Przeprowadź DPIA (Data Protection Impact Assessment) dla każdego wdrożenia przetwarzającego dane osobowe – wymóg RODO przy systemach AI.
  2. Sprawdź klasyfikację ryzyka wdrożonych systemów pod kątem AI Act (UE) – pełne wymagania dla systemów wysokiego ryzyka wchodzą w sierpniu 2026 r.
  3. Udokumentuj logikę działania agentów (Spark, Antigravity) dla wymagań przejrzystości AI Act.
  4. Skonfiguruj limity tokenów i alerty kosztowe w Google Cloud, by kontrolować wydatki API w PLN.

W kontekście AI Act warto zwrócić uwagę, że systemy agentyczne (jak Spark działający na danych pracowników) mogą wymagać klasyfikacji i rejestracji. Więcej o obowiązkach compliance omówiono w dziale Edukacja AI. Firmy szukające wsparcia w klasyfikacji systemów AI pod AI Act mogą skorzystać z zasobów polskiej platformy zgodności AI EU Act.

WebMCP i HTML-in-Canvas – co to oznacza dla developerów

Dwa nowe elementy techniczne ogłoszone równolegle z modelami:

WebMCP to rozszerzenie umożliwiające agentom AI dokładniejsze wykonywanie sekwencyjnych zadań w przeglądarce – z kontrolą błędów i powtarzalnością na poziomie produkcyjnym. To fundament dla automatyzacji procesów biurowych i operacji zaplecza e-commerce realizowanych przez agenty.

API HTML-in-Canvas otwiera możliwość osadzania trójwymiarowych, w pełni przeszukiwalnych doświadczeń w standardzie webowym – bez ciężkich wtyczek. Praktyczne zastosowania: interaktywne konfiguratory produktów, wirtualne showroomy, prezentacje ofertowe. Wszystko w technologii webowej dostępnej przez standardową przeglądarkę.

Dla zespołów developerskich oba elementy razem z Antigravity tworzą spójny ekosystem do budowania złożonych, agentycznych aplikacji webowych. Przegląd narzędzi developerskich z ekosystemu Google znajdziesz w katalogu Narzędzi AI.

Ostatnia aktualizacja: maj 2026
Często zadawane pytania

FAQ

Czym różni się Gemini 3.5 Flash od wcześniejszego Gemini 1.5 Flash?
Gemini 3.5 Flash oferuje okno kontekstowe 1 000 000 tokenów, przepustowość około 280 tokenów na sekundę i znacznie lepsze wyniki w benchmarkach agentycznych (Terminal-Bench 2.1: 76,2%, MCP Atlas: 83,6%). Poprzednie generacje nie były projektowane pod wieloetapowe procesy agentyczne z integracją Antigravity.
Czy Gemini Spark działa po polsku i jest dostępny w Polsce?
Tak – Google deklaruje dostępność w 98 językach i blisko 200 krajach od 19 maja 2026 roku. Spark jest zintegrowany z Google Workspace, który obsługuje język polski. Polskie firmy korzystające z planów Workspace for Business mogą aktywować agenta bez dodatkowej infrastruktury.
Ile kosztuje dostęp do Gemini 3.5 Flash przez API w przeliczeniu na PLN?
Orientacyjne stawki to około 6 PLN za 1M tokenów wejściowych i 36 PLN za 1M tokenów wyjściowych (przy kursie 1 USD ≈ 4 PLN). Cached input obniża koszt do około 0,60 PLN / 1M tokenów. Aktualne ceny w USD należy weryfikować w Google Cloud Console przed kalkulacją budżetu.
Jakie obowiązki compliance nakłada AI Act na wdrożenie Gemini Spark w firmie?
Systemy agentyczne przetwarzające dane pracowników lub klientów mogą wymagać klasyfikacji ryzyka zgodnie z AI Act (pełne wymagania od sierpnia 2026 r.) oraz DPIA na podstawie RODO. Konieczna jest dokumentacja logiki działania agenta i zapewnienie przejrzystości wobec osób, których dane są przetwarzane.
Czym jest Gemini Omni Flash i do czego służy w praktyce?
Gemini Omni Flash to pierwszy model z rodziny Omni – przyjmuje jednocześnie tekst, grafikę, wideo i dźwięk, a następnie edytuje lub generuje materiały wideo z zachowaniem spójności sceny, postaci i fizyki. W praktyce umożliwia edycję filmów marketingowych, zmianę tła czy stylu bez odrębnych narzędzi produkcyjnych.
Jak szybko można wdrożyć Gemini 3.5 Flash bez działu IT?
Najprostszą ścieżką jest Google AI Studio – dostęp przez przeglądarkę bez instalacji. Testy modelu można rozpocząć tego samego dnia co rejestracja. Integracja przez API z własnymi systemami wymaga podstawowej wiedzy programistycznej i zajmuje typowo od kilku dni do kilku tygodni, zależnie od złożoności workflowu.
Czytaj dalej

Powiązane artykuły