Przeskocz do treści
claude.ai

> Napisz mi ofertę dla klienta...

Co się teraz dzieje w środku?

tokeny attention trening generowanie granice
GENERATYWNA AI

AI pod maską

Co się dzieje między Twoim promptem a odpowiedzią

5 warstw technologii wyjaśnionych bez jednej linijki kodu
Dla marketerów, przedsiębiorców i ciekawych świata

~30 MIN CZYTANIA
SCROLLUJ
WARSTWA 1
1

Słowa stają się liczbami

Tokenizacja i embeddingi - jak AI "czyta" tekst ~6 MIN

Wpisujesz prompt: „Napisz mi ofertę dla klienta z Krakowa.” Ty widzisz słowa. AI widzi liczby. Pierwszy krok w każdym modelu językowym to zamiana tekstu na ciąg tokenów - kawałków słów, które AI potrafi przetwarzać.

KONCEPCJA

Tokenizacja

Co to jest: Podział tekstu na kawałki (tokeny) i przypisanie każdemu numeru. Słowo „marketing” to jeden token (ID: 39322). Słowo „hiperpersonalizacja” to prawdopodobnie 3-4 tokeny, bo jest długie i rzadkie.

Analogia: Wyobraź sobie tłumacza, który zanim przetłumaczy zdanie, rozbija je na kartoniki. Każdy kartonik to fragment - nie zawsze pełne słowo. „Niesamowity” staje się „nie” + „sam” + „owity”. Każdy kartonik ma swój numer w słowniku.

DEMO INTERAKTYWNE

Wpisz dowolny tekst i zobacz, jak AI go widzi:

Napisz mi ofertę dla klienta z Krakowa

8 tokenów | Szacunkowy koszt: ~0.0001 PLN (Claude Haiku)

I CO Z TEGO?

Dlatego dłuższy prompt kosztuje więcej. Płacisz za tokeny, nie za słowa. Prompt na 500 tokenów kosztuje 5x więcej niż na 100. Dlatego „zwięzły, precyzyjny prompt” to nie tylko lepsza odpowiedź - to także niższy rachunek.

Dlatego GPT nie umie liczyć liter. AI nie widzi liter - widzi tokeny. Słowo „strawberry” to 2-3 tokeny, nie 10 liter. Stąd klasyczny błąd: „Ile liter 'r' jest w 'strawberry'?” - AI nie ma dostępu do liter, bo operuje na wyższym poziomie.

KONCEPCJA

Embeddingi - adresy słów w wielowymiarowym mieście

Co to jest: Każdy token dostaje „adres” - wektor (listę liczb) w wielowymiarowej przestrzeni. Słowa o podobnym znaczeniu mają bliskie adresy. „Król” i „królowa” są blisko siebie. „Król” i „krzesło” - daleko.

Analogia: Wyobraź sobie miasto, w którym każde słowo ma swój adres. Synonimy mieszkają na tej samej ulicy. Antonimy - na przeciwnych końcach miasta. Słowa z tej samej kategorii („jabłko”, „gruszka”, „banan”) tworzą dzielnicę. AI nawiguje po tym mieście, szukając powiązań.

Przełom: W 2013 roku Google opublikował Word2Vec (Tomas Mikolov). Okazało się, że w przestrzeni embeddingów działają „równania”: król - mężczyzna + kobieta = królowa. Maszyna zaczęła „rozumieć” relacje między słowami.

LICZBY

GPT-4 ma słownik ~100 000 tokenów. Claude - podobnie. Każdy token jest reprezentowany przez wektor o ~12 000 wymiarach. Dla porównania: mapa GPS to 2 wymiary (długość, szerokość). Embedding to mapa o 12 000 wymiarach.

MIT

„AI rozumie słowa tak jak człowiek”

FAKT

AI nie „rozumie” słów. Operuje na wektorach liczbowych. Nie wie, co znaczy „miłość” - wie, że wektor „miłość” jest bliski wektorom „uczucie”, „serce”, „związek”. To wystarczy do generowania sensownego tekstu. Ale to nie jest rozumienie - to statystyczna bliskość.

2013 Google publikuje Word2Vec - słowa stają się wektorami. "Król - mężczyzna + kobieta = królowa" działa.
WARSTWA 2
2

Maszyna, która rozumie kontekst

Mechanizm Attention i architektura Transformer ~7 MIN

Masz tokeny. Masz embeddingi. Ale zdanie „Bank rzeki był stromy” i „Byłem w banku po kredyt” używają tego samego słowa „bank” z zupełnie innym znaczeniem. Skąd AI wie, o który bank chodzi? Odpowiedź: attention - mechanizm, który zmienił wszystko.

KONCEPCJA

Mechanizm Attention - „na co patrzę?”

Co to jest: Każdy token „patrzy” na wszystkie inne tokeny w zdaniu i decyduje, które są dla niego ważne. W zdaniu „Kot siedział na macie, bo był zmęczony” - token „był” musi „wiedzieć”, że odnosi się do „kot”, nie do „mata”. Attention to robi.

Analogia: Wyobraź sobie reflektor na scenie teatralnej. Aktor (token) ma swój reflektor i może skierować go na dowolnego innego aktora. Gdy mówi „on był zmęczony” - reflektor oświetla „kota”, bo to on jest zmęczony. Każdy aktor ma własny reflektor. To jest self-attention.

Przełom: W 2017 roku zespół Google opublikował paper „Attention Is All You Need” (Vaswani et al.). Tytuł mówi wszystko - attention to jedyny mechanizm, którego potrzebujesz. Reszta jest dodatkiem.

DEMO INTERAKTYWNE

Najedź na słowo - zobacz, na co „patrzy” AI:

Kot siedział na macie bo był zmęczony

Token „był” patrzy najsilniej na „Kot” (0.42) i „zmęczony” (0.31)

KONCEPCJA

Multi-Head Attention - 12 par oczu naraz

Co to jest: Zamiast jednego reflektora, AI ma 12, 32, a nawet 96 reflektorów jednocześnie. Każdy „patrzy” na coś innego. Jeden śledzi gramatykę (podmiot-orzeczenie). Drugi - znaczenie (kto co robi). Trzeci - emocje. Razem dają pełny obraz zdania.

Analogia: Jak panel ekspertów czytających to samo zdanie. Lingwista patrzy na gramatykę. Psycholog na emocje. Logik na strukturę argumentu. Każdy widzi co innego. Razem rozumieją więcej niż którykolwiek z nich osobno.

KONCEPCJA

Transformer - architektura, która rządzi AI

Co to jest: Transformer to cała „maszyna”, która łączy attention z innymi elementami: normalizacja, sieci feed-forward, residual connections. Wchodzi tekst (tokeny). Przechodzi przez 32-96 warstw attention. Wychodzi zrozumienie kontekstu.

Dlaczego wygrał: Przed Transformerem AI czytała tekst słowo po słowie (RNN/LSTM) - jak czytanie książki od lewej do prawej. Transformer czyta wszystkie słowa naraz i oblicza relacje między nimi równolegle. To jest 100-1000x szybsze do trenowania na GPU.

Kto go używa: GPT (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta) - WSZYSTKIE duże modele językowe bazują na Transformerze. To jest Intel Inside świata AI.

I CO Z TEGO?

Dlatego precyzyjny prompt daje lepszą odpowiedź. Attention przypisuje wagę każdemu tokenowi. Jeśli napiszesz „napisz coś o marketingu”, wagi rozkładają się równo - AI nie wie, co jest ważne. Jeśli napiszesz „napisz 3 nagłówki email B2B dla branży SaaS z CTA na demo” - attention koncentruje się na kluczowych tokenach. Więcej kontekstu = lepsze attention = lepszy wynik.

LICZBY

GPT-4 ma 96 warstw Transformer i 96 głów attention w każdej. To znaczy, że na każdy token patrzą jednocześnie 96 „reflektory” - w każdej z 96 warstw. Claude 3.5 Sonnet: ~80 warstw. Llama 3 405B: 126 warstw.

MIT

„AI czyta tekst od lewej do prawej, jak człowiek”

FAKT

Transformer przetwarza wszystkie tokeny jednocześnie (podczas treningu). Każdy token „widzi” każdy inny. To jak czytanie całej strony naraz, zamiast litera po literze. Dlatego AI łapie kontekst z końca zdania, nawet gdy jeszcze „nie doczytała” do końca.

2017 Google publikuje "Attention Is All You Need" - architektura Transformer. Przełom, który umożliwił GPT, Claude i każdy inny duży model językowy.
SPRAWDŹ SIĘ

Pytanie 1: Dlaczego AI ma problem z policzeniem liter w słowie „strawberry”?

Pytanie 2: Co robi mechanizm attention?

WARSTWA 3
3

Jak AI się uczy

Trening, RLHF i dlaczego Claude odpowiada inaczej niż GPT ~7 MIN

Masz architekturę (Transformer). Masz sposób na czytanie tekstu (tokenizacja + embeddingi + attention). Ale skąd AI „wie”, co odpowiedzieć? Odpowiedź: z treningu. I ten trening składa się z trzech etapów - jak edukacja dziecka.

KONCEPCJA

Etap 1: Pre-training - czytanie internetu

Co to jest: Model czyta biliony tokenów tekstu (książki, strony www, Wikipedia, kod, artykuły naukowe) i uczy się jednego zadania: przewidzieć następny token. Widzi „Stolica Polski to...” i uczy się, że następny token to prawdopodobnie „Warszawa.”

Analogia: Jak dziecko, które czyta miliony książek. Nie uczy się z podręcznika „stolica Polski = Warszawa.” Uczy się z kontekstu - bo tysiące razy widziało zdanie „stolica Polski to Warszawa” w różnych tekstach. Z tego wyłania się „wiedza.”

Skala: GPT-3 trenowano na ~300 miliardach tokenów. Llama 3 - na 15 bilionach. To jak przeczytanie 40 milionów książek.

KONCEPCJA

Etap 2: Fine-tuning - nauka dobrych manier

Co to jest: Po pre-treningu model „wie dużo”, ale odpowiada dziwnie - może dokończyć zdanie, ale nie potrafi prowadzić rozmowy. Fine-tuning (SFT - Supervised Fine-Tuning) uczy go formatu: pytanie -> odpowiedź. Ludzie piszą tysiące przykładowych dialogów, a model się na nich dostraja.

Analogia: Dziecko przeczytało milion książek i wie, jak działa świat. Ale nie umie się zachować w towarzystwie. Fine-tuning to „szkoła dobrych manier” - uczy formatu interakcji.

KONCEPCJA

Etap 3: RLHF / DPO - uczenie się od ludzi

Co to jest: Model generuje odpowiedzi. Ludzie je oceniają - „ta jest lepsza, ta gorsza.” Z tych ocen model uczy się preferencji. RLHF (Reinforcement Learning from Human Feedback) to metoda OpenAI. DPO (Direct Preference Optimization) to nowsza, prostsza alternatywa. Anthropic dodaje Constitutional AI - model sam sobie stawia pytania etyczne.

Analogia: Jak junior w nowej pracy. Pisze maile, szef je czyta i mówi: „ten jest dobry, ten za formalny, ten za luźny.” Z każdym dniem junior pisze lepiej - bo uczy się preferencji szefa. RLHF to ten sam mechanizm, ale z tysiącami „szefów” oceniających odpowiedzi.

Dlaczego Claude odpowiada inaczej niż GPT: Inne dane treningowe + inny fine-tuning + inny RLHF = inny „charakter.” Anthropic stosuje Constitutional AI (model sam ocenia swoje odpowiedzi pod kątem zasad). OpenAI używa klasycznego RLHF. Dlatego Claude jest bardziej ostrożny, a GPT bardziej bezpośredni. To nie bug - to design.

KONCEPCJA

Scaling Laws - większy = lepszy (do pewnego momentu)

Co to jest: W 2020 roku OpenAI odkrył prawidłowość: wydajność modelu rośnie przewidywalnie z rozmiarem (parametry), ilością danych i mocą obliczeniową. Podwojenie rozmiaru = stała poprawa. To jest powód, dla którego firmy budują coraz większe modele.

Ale: Chinchilla (Google, 2022) pokazał, że ważniejsza od rozmiaru jest ilość danych treningowych. Model 70B trenowany na większej ilości danych bije model 175B trenowany na mniejszej. Nie wystarczy być dużym - trzeba być dobrze wyedukowanym.

I CO Z TEGO?

Dlatego system prompts mają moc. Fine-tuning i RLHF tworzą „bazową osobowość” modelu. Ale system prompt (instrukcja na początku rozmowy) działa jak „codzienny briefing” - może tymczasowo zmienić zachowanie modelu. Dobry system prompt to jak dobry brief dla pracownika.

Dlatego nowe modele są lepsze. Nie dlatego, że są „mądrzejsze” - ale dlatego, że widziały więcej danych, miały lepszy fine-tuning i więcej ludzkiego feedbacku. GPT-4 nie jest „inteligentniejszy” od GPT-3. Jest lepiej wyedukowany.

LICZBY - KOSZT TRENINGU
ModelParametrySzacunkowy koszt
GPT-2 (2019)1,5 mld~50 tys. USD
GPT-3 (2020)175 mld~4,6 mln USD
GPT-4 (2023)~1,8 bln (MoE)~50-100 mln USD
Llama 3 405B (2024)405 mld~30-60 mln USD
MIT

„AI się uczy z naszych rozmów na bieżąco”

FAKT

Trening modelu (pre-training + fine-tuning) trwa tygodnie na tysiącach GPU i kosztuje miliony dolarów. Twoja rozmowa z ChatGPT NIE zmienia modelu. Model jest „zamrożony” po treningu. Twój prompt to input, nie trening. (API providers mogą zbierać dane do przyszłych wersji - ale bieżący model się nie zmienia.)

2020 GPT-3 (175 mld parametrów) i Scaling Laws paper - OpenAI pokazuje, że rozmiar = jakość. Początek wyścigu na miliardy parametrów.
WARSTWA 4
4

Generowanie - słowo po słowie

Next token prediction, temperature i dlaczego AI halucynuje ~6 MIN

Teraz najważniejsze pytanie: jak AI generuje odpowiedź? Odpowiedź jest jednocześnie prosta i dziwna. AI generuje jeden token na raz. Tylko jeden. I potem kolejny. I kolejny. Jak pisarz, który nie zna końca zdania, dopóki go nie napisze.

KONCEPCJA

Next Token Prediction - serce generowania

Co to jest: Model dostaje prompt („Stolica Polski to”), przetwarza go przez Transformer i oblicza prawdopodobieństwo KAŻDEGO tokenu w słowniku jako następnego. „Warszawa” dostaje 0.72. „Kraków” - 0.08. „Piękna” - 0.003. Model wybiera jeden - i ten token staje się częścią kontekstu dla kolejnego kroku.

Analogia: Jak autokorekta w telefonie - piszesz „Dziś jest piękna p...” i telefon podpowiada „pogoda” (najwyższe prawdopodobieństwo). LLM robi to samo, ale na poziomie całych zdań, z miliardami parametrów zamiast prostego słownika.

Kluczowy insight: AI nie wie, co chce powiedzieć, zanim to powie. Nie planuje zdania od początku do końca. Generuje token po tokenie. Dlatego czasem zaczyna zdanie, które nie da się dobrze skończyć - bo „nie wiedziała”, dokąd zmierza.

KONCEPCJA

Temperature - suwak kreatywności

Co to jest: Temperature kontroluje, jak „ryzykownie” model wybiera następny token. Niska temperature (0.1) = model prawie zawsze wybiera token z najwyższym prawdopodobieństwem. Wysoka (1.5) = model częściej wybiera mniej prawdopodobne tokeny.

Temperature 0.1: „Stolica Polski to Warszawa.” (zawsze tak samo)

Temperature 1.0: „Stolica Polski to Warszawa, choć Kraków ma swój urok.” (bardziej kreatywnie)

Temperature 2.0: „Stolica Polski to taniec światła na dachach Pałacu Kultury...” (chaotycznie, ale ciekawie)

DEMO INTERAKTYWNE

Przesuń suwak i zobacz, jak zmienia się odpowiedź AI:

0.0 precyzyjne 1.0 zbalansowane 2.0 kreatywne

„Marketing to strategiczne zarządzanie procesem wymiany wartości między organizacją a jej klientami.”

Temperature: 0.7

Wskazówka: 0.1-0.3 do raportów i analiz | 0.7-0.9 do kreatywnego pisania | 1.0+ do brainstormu

KONCEPCJA

Halucynacje - dlaczego AI „kłamie”

Co to jest: AI generuje tekst, który brzmi wiarygodnie, ale jest faktycznie nieprawdziwy. „Cytuje” książki, które nie istnieją. Podaje statystyki z powietrza. Tworzy „źródła” z poprawnym formatowaniem, ale fałszywą treścią.

Dlaczego to się dzieje: Model nie „wie”, co jest prawdą. Model przewiduje, jaki token jest najbardziej prawdopodobny w danym kontekście. Jeśli kontekst sugeruje, że powinien podać źródło - podaje. Nawet jeśli go nie zna. Bo jego zadaniem nie jest „mówić prawdę.” Jego zadaniem jest „generować najbardziej prawdopodobny następny token.”

Analogia: Jak student, który nie przygotował się do egzaminu, ale pisze tak przekonująco, że profesor nie zauważa. Student nie kłamie świadomie - po prostu generuje „najbardziej prawdopodobną odpowiedź” na podstawie fragmentarycznej wiedzy. AI robi dokładnie to samo.

I CO Z TEGO?

Dlatego MUSISZ weryfikować fakty. AI generuje najbardziej prawdopodobny tekst - nie najbardziej prawdziwy. Każda statystyka, cytat i źródło wymaga sprawdzenia. To nie jest wada - to natura technologii. Kto to rozumie, używa AI efektywnie. Kto nie - narazi się na błędy.

Dlatego temperature ma znaczenie. Do raportów, analiz i faktografii: temperature 0.1-0.3 (mniej halucynacji). Do brainstormu i kreacji: 0.7-1.0 (więcej kreatywności, ale mniej precyzji). Dopasuj narzędzie do zadania.

MIT

„AI kłamie, więc nie można jej ufać”

FAKT

AI nie kłamie - bo nie wie, co jest prawdą. Generuje najbardziej prawdopodobny tekst. To jak kompas: pokazuje kierunek, nie cel. Użyteczny, ale wymaga mapy (Twojej wiedzy i weryfikacji). Problem nie w narzędziu - w oczekiwaniu, że narzędzie jest nieomylne.

LICZBY - GENEROWANIE

GPT-4 generuje ~80-100 tokenów/sekundę. Claude 3.5 Sonnet: ~90 tokenów/s. Context window: GPT-4 Turbo: 128k tokenów. Claude: 200k (1M beta). Llama 3: 128k. Dłuższy kontekst = więcej „pamięci” w rozmowie, ale wyższy koszt.

2022 ChatGPT (30 listopada 2022) - 100 milionów użytkowników w 2 miesiące. Najszybciej rosnąca aplikacja w historii. Generatywna AI trafia do mainstreamu.
SPRAWDŹ SIĘ

Pytanie 3: Dlaczego AI halucynuje (podaje fałszywe fakty)?

Pytanie 4: Jakie ustawienie temperature najlepsze do raportu finansowego?

WARSTWA 5
5

Granice i przyszłość

Co AI nie umie, emergentne zdolności i Twoja rola w pętli ~5 MIN

Wiesz już, jak AI czyta (tokenizacja), rozumie kontekst (attention), uczy się (trening) i generuje (next token). Ostatnia warstwa: co nie działa. I co się zmienia.

KONCEPCJA

Czego AI nie umie (i dlaczego)

Nie rozumie świata. AI nie ma doświadczeń, ciała ani zmysłów. „Wie”, że ogień jest gorący - bo przeczytała to milion razy. Ale nie wie, jak to jest się poparzyć.

Nie ma pamięci między sesjami. Każda nowa rozmowa to czysta karta (chyba że użyjesz narzędzi z pamięcią). Model nie „pamięta” Twojego wczorajszego promptu.

Nie planuje. Generuje token po tokenie. Nie ma „planu na zdanie” ani „strategii na akapit.” Extended thinking (Anthropic) i Chain-of-Thought częściowo to kompensują - ale to workaround, nie prawdziwe planowanie.

Nie wie, czego nie wie. Człowiek potrafi powiedzieć „nie wiem.” AI tego nie umie naturalnie. Jej zadaniem jest generować prawdopodobny tekst. A „nie wiem” rzadko jest najbardziej prawdopodobną odpowiedzią.

KONCEPCJA

Emergentne zdolności - niespodzianki skali

Co to jest: Przy pewnym rozmiarze modelu pojawiają się zdolności, których nikt nie zaprogramował. GPT-2 (1,5 mld) nie umie programować. GPT-3 (175 mld) nagle potrafi. Nikt tego nie planował - zdolność „wyłoniła się” ze skali.

Analogia: Jak mrowisko. Żadna mrówka nie wie, że buduje most. Ale kolonia jako całość - buduje. Emergentne zdolności AI działają tak samo: żaden pojedynczy neuron „nie umie” programować. Ale miliardy neuronów razem - potrafią.

Przykłady: Rozumowanie matematyczne, pisanie kodu, tłumaczenie między językami, na których nie było trenowane, gra w szachy, analiza emocji. Żadna z tych zdolności nie była celem treningu. Cel treningu to „przewiduj następny token.” Reszta pojawiła się jako efekt uboczny.

Dlaczego to ważne: Oznacza to, że następne modele mogą mieć zdolności, których nie potrafimy przewidzieć. To jest jednocześnie ekscytujące i niepokojące.

KONCEPCJA

Alignment - czy AI chce tego, co my?

Co to jest: Alignment to problem zapewnienia, że AI działa zgodnie z ludzkimi intencjami. RLHF i Constitutional AI to narzędzia alignmentu - uczą model „co powinien, a czego nie powinien robić.”

Dlaczego to trudne: Nie da się opisać WSZYSTKICH zasad. Świat jest zbyt złożony. „Bądź pomocny” - ale co gdy ktoś prosi o pomoc w czymś nieetycznym? „Mów prawdę” - ale co gdy prawda może kogoś skrzywdzić? To są dylematy, z którymi ludzkość zmaga się od tysiącleci. Teraz musimy je zakodować w maszynie.

Analogia: Jak uczenie psa komendy „bądź grzeczny.” Łatwe do powiedzenia. Niemożliwe do zdefiniowania w każdej sytuacji. Pies musi „zrozumieć ducha” komendy, nie literę. Z AI jest tak samo.

LICZBY - SKALA ZMIAN

HuggingFace (marzec 2026): 1 000 000+ modeli open-source. W 2022 było ich ~50 000. Wzrost 20x w 4 lata. Meta wydał Llama 3 open-source (405 mld parametrów). Google, Anthropic i OpenAI publikują po 2-3 nowe modele rocznie. Tempo zmian nie zwalnia.

I CO Z TEGO?

Twoja rola: człowiek w pętli. AI jest narzędziem. Potężnym, ale narzędziem. Twoja ekspertyza, weryfikacja i osąd są kluczowe. AI generuje. Ty decydujesz. AI proponuje. Ty weryfikujesz. To nie jest relacja „AI zamiast człowieka.” To jest relacja „AI + człowiek > każde z nich osobno.”

5 mitów o AI - obalonych

MIT 1

"AI myśli jak człowiek"

FAKT

AI oblicza prawdopodobieństwo następnego tokenu. Nie "myśli", nie "czuje", nie "chce." Produkuje statystycznie prawdopodobny tekst. To wystarczy do wielu zadań - ale to nie jest myślenie.

MIT 2

"AI zastąpi marketerów"

FAKT

AI zastąpi marketerów, którzy robią tylko to, co AI robi za darmo. Marketerów ze strategią, kreatywnością i osądem - wzmocni. To nie jest kwestia "czy AI", ale "czy Ty + AI."

MIT 3

"Większy model = zawsze lepszy"

FAKT

Claude Haiku 4.5 (mały, tani) bije GPT-3 (duży, drogi) w wielu zadaniach. Chinchilla (70B, dużo danych) bije modele 175B (mniej danych). Rozmiar to nie wszystko. Jakość treningu, danych i fine-tuningu ma znaczenie.

MIT 4

"AI uczy się z moich rozmów"

FAKT

Twoja rozmowa to input, nie trening. Model jest "zamrożony" po treningu. Twój prompt nie zmienia miliardów parametrów. Dostawcy MOGĄ zbierać dane do przyszłych wersji (sprawdź politykę) - ale bieżąca sesja nie zmienia modelu.

MIT 5

"AI jest obiektywna"

FAKT

AI odzwierciedla dane, na których była trenowana. Jeśli internet jest stronniczy (a jest) - AI też będzie. RLHF i Constitutional AI łagodzą to, ale nie eliminują. Krytyczne myślenie jest Twoją supermocą, nie AI.

2024-2026 Claude 4.x, GPT-5.x, Gemini 2.x/3.x, open-source (Llama 3, DeepSeek). Emergentne zdolności rosną. Wyścig o alignment przyspiesza. AI staje się codziennym narzędziem pracy.
EPILOG

Teraz wiesz więcej niż 95% marketerów w Polsce

Właśnie przeszedłeś przez 5 warstw - od tokenów po alignment. Oto co wiesz:

1 Tokenizacja: AI nie widzi słów - widzi tokeny (kawałki słów jako liczby)
2 Attention: Każdy token "patrzy" na inne - kontekst decyduje o znaczeniu
3 Trening: Pre-training (czytanie internetu) + Fine-tuning (dobre maniery) + RLHF (ludzki feedback)
4 Generowanie: Token po tokenie, na podstawie prawdopodobieństwa - dlatego AI halucynuje
5 Granice: AI nie rozumie, nie planuje i nie wie, czego nie wie - Twoja rola to weryfikacja

To nie jest wiedza akademicka. To jest operacyjna przewaga. Znasz mechanizm. Rozumiesz, dlaczego precyzyjny prompt działa lepiej. Dlaczego temperature ma znaczenie. Dlaczego musisz weryfikować fakty. Dlaczego AI halucynuje - i jak z tym pracować.

ŹRÓDŁA I DALSZE CZYTANIE

  • Vaswani et al. (2017) - „Attention Is All You Need” - paper, który zapoczątkował erę Transformerów
  • Kaplan et al. (2020) - „Scaling Laws for Neural Language Models” - OpenAI, prawa skalowania
  • Ouyang et al. (2022) - „Training language models to follow instructions with human feedback” - RLHF paper
  • Rafailov et al. (2023) - „Direct Preference Optimization” - DPO jako alternatywa dla RLHF
  • Bai et al. (2022) - „Constitutional AI” - Anthropic, samouczenie się zasad