Bias-ul AI în triajul CV-urilor: de ce LLM-urile preferă CV-urile scrise de AI (studiu 2025)

8 min de citit · Actualizat la 5 iunie 2026

De Bogdan

Pe scurt

Un studiu publicat în 2025 la ACM EAAMO/AIES (Xu, Li & Jiang, arXiv:2509.00462) a testat șapte LLM-uri majore — GPT-4o, GPT-4-turbo, GPT-4o-mini, LLaMA 3.3-70B, Mistral-7B, Qwen-2.5-72B și DeepSeek-V3 — și a constatat că filtrele AI preferă sistematic CV-urile scrise de propriul model față de versiuni identice scrise de oameni sau de AI concurente. GPT-4o și-a ales propriul CV 82% din timp; LLaMA 3.3-70B 79%; DeepSeek-V3 72%; restul între 65 și 82%. În simulări de angajare pe 24 de ocupații, candidații care au folosit același LLM ca filtrul recrutorului aveau cu 23-60% mai multe șanse să ajungă pe lista scurtă decât candidați la fel de calificați cu CV scrise de mână — cel mai mare dezavantaj în roluri de business precum vânzări și contabilitate. Cauză: textul cu perplexitate mică (familiar modelului) câștigă automat. Concluzie practică: scrie tu conținutul CV-ului, folosește AI doar pentru a lustrui formularea, nu lipi niciodată un CV generat de AI cuvânt cu cuvânt dacă nu știi ce model de triere folosește angajatorul, și declară asistența AI dacă un rol cere această politică.

Ce a descoperit cu adevărat studiul

În septembrie 2025, trei cercetători — Jiannan Xu (University of Maryland), Gujie Li (Cornell) și Jane Yi Jiang — au publicat un articol intitulat „AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights" (arXiv:2509.00462; prezentat la ACM EAAMO 2025 și AIES 2025). Este primul test empiric la scară largă al unei întrebări în jurul căreia comunitatea de echitate AI se învârtea de doi ani: atunci când LLM-urile evaluează text, preferă pe ascuns text care sună ca propria scriere?

Setup-ul a fost curat. Au luat 2.245 de CV-uri reale anonimizate de pe LiveCareer.com, acoperind 24 de categorii ocupaționale. Pentru fiecare CV au generat rescrieri AI folosind șapte LLM-uri — trei comerciale (GPT-4o, GPT-4-turbo, GPT-4o-mini) și patru open-source (LLaMA 3.3-70B, Mistral-7B, Qwen-2.5-72B, DeepSeek-V3). Apoi au cerut fiecărui model să evalueze perechi de CV-uri (unul scris de el însuși, unul de către un om sau de către un model concurent) și să aleagă candidatul mai puternic. Calitatea conținutului a fost controlată — același rol, aceeași experiență, aceleași realizări — diferea doar suprafața prozei.

Rezultatul: fiecare model își prefera propria scriere, adesea dramatic. Rate de auto-preferință pe model față de CV-uri scrise de oameni:

  • GPT-4o — 82% (și-a ales propriul CV în 4 din 5 cazuri)
  • LLaMA 3.3-70B — 79%
  • DeepSeek-V3 — 72%
  • GPT-4-turbo și Qwen-2.5-72B — ambele peste 65%
  • Mistral-7B — 28% (unul dintre puținele rezultate aproape neutre)
  • LLaMA 3.2-3B (cel mai mic testat) — 11,6% (modelele cele mai mici au arătat aproape zero bias, sugerând că efectul scalează cu capacitatea modelului)

Crucial: bias-ul a supraviețuit testelor de robustețe. Potrivirea perechilor de CV după conținut semantic prin BERTScore și ROUGE-L sau după stilul de scriere prin caracteristici lingvistice LIWC nu l-a făcut să dispară. Preferința nu urmărea calitatea sau stilul — urmărea dacă textul suna ca propriile ieșiri ale modelului evaluator.

De ce se întâmplă asta — mecanismul perplexității

LLM-urile evaluează intern fiecare intrare prin perplexitate — aproximativ, cât de surprins este modelul de fiecare token următor. Textul pe care modelul l-ar fi generat plauzibil singur are perplexitate mică (previzibil, familiar); textul scris într-un stil necunoscut sau cu formulări rare are perplexitate mare. Studiul lui Xu/Li/Jiang a constatat că atunci când LLM-urilor li se cere să evalueze calitatea textului, ele atribuie scoruri semnificativ mai mari pasajelor cu perplexitate mică — chiar și când calitatea reală a conținutului este identică.

Cel mai simplu mod de a te gândi la asta: un evaluator LLM nu judecă cu adevărat „este un CV bun?". El execută un calcul semi-conștient de „arată acest CV ca genul de lucru pe care l-aș fi scris?", și apoi proiectează acea recunoaștere a fluenței asupra calității. Familiaritate → fluență → judecată ca de calitate superioară. Perplexitatea mai mică o învinge pe cea mai mare, punct, chiar și când ambii candidați sunt obiectiv la fel de buni.

Este același mecanism psihologic pe care îl avem noi, oamenii, când judecăm scrierea care ne oglindește propriul stil ca „mai clară" sau „mai profesională" — dar în LLM-uri operează mult mai rapid și fără introspecție. Cercetătorii notează că acesta nu este un bug într-un model specific. Este o proprietate sistemică a modului în care modelele de limbaj bazate pe transformere evaluează textul. Fiecare LLM major prezintă o versiune a sa.

Impactul în lumea reală — 23-60% mai multe liste scurte

Să știi că un LLM își preferă propria scriere în 82% într-un test pereche controlat este interesant academic. Întrebarea reală este: contează când concurezi cu un teanc de alți candidați pentru un job real?

Pentru a afla, autorii au rulat pipeline-uri de angajare simulate pe toate cele 24 de categorii ocupaționale. În fiecare rundă: era asamblat un grup de candidați, unii își aveau CV-urile rafinate de GPT-4o (modelul de triere al recrutorului), alții foloseau LLM-uri diferite, alții își păstrau CV-urile originale scrise de mână. LLM-ul de triere apoi clasifica grupul și producea o listă scurtă.

Candidații ale căror CV-uri fuseseră rafinate de același LLM ca filtrul (GPT-4o → GPT-4o) aveau cu 23-60% mai multe șanse să ajungă pe lista scurtă decât candidați la fel de calificați cu CV scrise de mână. Cele mai mari dezavantaje — mai aproape de extrema de 60% — apăreau în ocupații orientate spre business: vânzări, contabilitate, marketing, servicii pentru clienți. Cele mai mici diferențe apăreau în roluri tehnice unde conținutul CV-ului (unelte specifice, limbaje, certificări) depășește stilul prozei.

Tradu asta în realitatea căutării de job: dacă un rol de vânzări primește 200 de aplicanți și ATS-ul recrutorului prefilterează cu GPT-4o, un aplicant care și-a lustruit CV-ul cu GPT-4o are statistic mult mai multe șanse să ajungă în teancul de revizuire umană decât un aplicant de calibru identic al cărui CV a fost scris fără AI. Nu e un avantaj mic.

De ce este mai mare decât „încă un bias AI"

Cercetarea privind echitatea AI a petrecut un deceniu documentând bias-ul față de grupuri demografice — gen, rasă, vârstă, dizabilitate. Aceste bias-uri sunt bine înțelese și combătute activ legislativ în UE (clasificarea de risc ridicat a AI de recrutare în AI Act) și în mai multe jurisdicții din SUA (NYC Local Law 144, Illinois AI Video Interview Act etc.).

Bias-ul de auto-preferință e diferit. Nu urmărește o caracteristică protejată; urmărește dacă ai folosit aceeași marcă AI ca angajatorul tău. Sună inofensiv — până observi că piața LLM este concentrată. GPT-4o (OpenAI) este modelul de triere cel mai larg desfășurat în lumea corporativă, și este și LLM-ul de consum cel mai larg utilizat. Prin urmare bias-ul favorizează sistematic candidații cu abonamente plătite la ChatGPT față de candidații care folosesc Claude, Gemini sau DeepSeek gratuite — și față de candidații care scriu fără AI deloc.

Este un bias cuplat cu avere și acces ascuns în interiorul a ceea ce pare un proces algoritmic neutru. Spre deosebire de bias-ul demografic, niciunei reglementări existente nu îi vine să-l adreseze. Autorii cer explicit cadre de echitate extinse care să acopere „interacțiunile AI-AI" — bias-uri care apar nu din modul în care un algoritm tratează o persoană, ci din modul în care un algoritm tratează ieșirea altui algoritm. Acea categorie de daună este complet nouă în literatura de politici.

Ce înseamnă asta pentru tine, candidatul

Fără panică. Bias-ul e real, dar răspunsul rațional nu e „niciodată nu folosi AI" — este „folosește AI într-un mod care să nu facă CV-ul tău trivial identificabil ca ieșire a unui model". Cinci implicații practice:

  • Scrie tu substanța. Realizări specifice, numere, date, nume de proiecte, conținutul real al rolului tău — sunt fapte pe care AI nu le poate inventa fără să halucineze. A le scrie tu însuți nu este negociabil atât pentru onestitate cât și pentru a preveni semnele evidente (companii inventate, procente suspect de rotunde).
  • Folosește AI pentru a lustrui, nu pentru a redacta. A cere unui LLM „rescrie bullet-ul meu să sune mai impactant" îți dă o îmbunătățire a formulării pe conținutul tău real. A-i cere „scrie-mi un CV pentru un manager de marketing" îți dă proză AI generică ce-și strigă originea la fiecare filtru — și la orice evaluator uman cu două luni de experiență.
  • Nu lipi o ieșire de model unic cuvânt cu cuvânt. Dacă 82% din bias vine din faptul că un LLM își recunoaște propriile ieșiri, cea mai proastă strategie posibilă este să trimiți proza needitată a aceluiași LLM unui filtru care ar putea fi același model. Mixează surse: redactează tu, lustruiește cu un instrument, fă o trecere finală cu un alt instrument, editează rezultatul de mână.
  • Nu suna robotic. Bias-ul recompensează formulările familiare modelului — dar un evaluator uman cu experiență poate identifica „Ca profesionist orientat spre rezultate cu pasiune pentru excelență" de la zece pași. Compromisul e vocea: păstrează-ți propriul ritm al frazei și alegerea cuvintelor, folosește AI doar pentru ajustări de gramatică/concizie.
  • Fii cinstit dacă ești întrebat. Un număr mic dar în creștere de angajatori UE — în special în sectoare reglementate precum finanțe, sănătate și administrație publică — cere candidaților explicit să declare asistența AI în aplicații. Dacă instrucțiunile unui rol cer, declară. A minți despre asta este motiv să i se retragă cuiva oferta în orice moment ulterior.

Ce înseamnă asta pentru angajatori și recrutori

Dacă ești de cealaltă parte a mesei, articolul are implicații incomode. Triajul de CV cu un singur model nu mai e apărabil ca „obiectiv". Dacă ATS-ul tău folosește GPT-4o pentru a clasifica aplicanții și recrutezi pentru un rol de vânzări, dezavantajezi sistematic candidații care au plătit pentru același model — iar acel avantaj nu are nicio legătură cu faptul că pot vinde sau nu.

Studiul lui Xu/Li/Jiang a testat două măsuri de atenuare care au funcționat:

  1. Dezvăluire la nivel de prompt. Adăugarea unei propoziții la prompt-ul de triere — „Nu trebuie să iei în considerare sau să deduci dacă CV-urile au fost scrise de un om sau de o AI. Concentrează-te doar pe calitatea conținutului." — a redus bias-ul măsurabil. Ieftin, gratuit, parțial.
  2. Ansamblu cu vot majoritar. Combinarea evaluatorului primar cu două modele mai mici (de ex. GPT-4o plus LLaMA 3.2-1B și LLaMA 3.2-3B) și folosirea votului majoritar pentru decizia finală a listei scurte a redus bias-ul cu peste 50%. Modelele mai mici au arătat aproape zero auto-preferință, deci au servit ca contrapondere pentru bias-ul modelului primar. Mai mult calcul, mult mai multă echitate.

Specific pentru angajatorii UE: AI Act clasifică AI-ul de recrutare ca risc ridicat. A ști că triajul cu un singur model introduce un bias măsurabil, non-demografic, care dezavantajează candidații cu mai puțin acces la același serviciu AI plătit, probabil intersectează obligațiile de transparență și echitate ale Act-ului. Documentează-ți strategia de atenuare înainte să ai nevoie de ea.

Versiunea cinstită: ar trebui să folosești AI pe CV-ul tău în general?

Trei scenarii cinstite. Alege-l pe cel care se potrivește realității tale.

Scenariul A: aplici la o corporație mare care probabil face triaj ATS cu GPT-4o. Avantajul de listă scurtă de 23-60% este real aici. Folosirea unui LLM mare pentru a-ți lustrui CV-ul (NU pentru a-l redacta) îți dă avantajul fără semnele evidente. Concluzie: folosește AI cu grijă.

Scenariul B: aplici la o companie mică/mijlocie unde un recrutor uman citește CV-ul mai întâi. LLM-ul de triere nu există în acest pipeline. Proza AI robotică te dezavantajează activ aici — oamenii o pot identifica, iar mulți o penalizează activ ca lipsă de efort percepută. Concluzie: scrie-l tu, folosește AI cu moderație pentru gramatică.

Scenariul C: aplici în mediul academic, sănătate sau administrație publică în UE. Dezvăluirea AI este tot mai cerută. Proza fluentă în AI poate fi citită ca steag roșu în loc de verde. Concluzie: AI minim, de preferat deloc, declară dacă a fost folosită asistență.

În toate cele trei scenarii, o regulă este universală: nu lăsa AI să-ți scrie conținutul faptic. Realizările, numerele și specificul proiectelor trebuie să vină de la tine. AI este un lustruit de formulare, nu un generator de substanță.

Cum abordăm asta la TakeMeUp.cv

Dezvăluire completă: construim un instrument de CV și livrăm funcții AI. Așa că aceasta este secțiunea jenantă unde trebuie să fim transparenți despre propriul nostru produs într-un articol care documentează bias-uri în instrumentele AI.

Add-on-ul nostru AI Rewrite este deliberat limitat la lustruit la nivel de formulare, nu la generare de bullet-uri. Rescrie un bullet pe care l-ai scris tu într-o versiune mai puternică a lui însuși — păstrând numerele tale, datele tale, numele proiectelor tale și substanța a ceea ce ai făcut de fapt. Refuză să inventeze metrici. Nu e virtue signaling; este singura poziție de produs pe care o putem apăra într-o lume în care fabricarea CV-urilor generate de AI este endemică. Add-on-ul nostru Authenticity Score există tocmai pentru că știm că recrutorii încep să identifice proza unui singur LLM.

Rezerve și ce nu știm încă

Studiul lui Xu/Li/Jiang este cea mai puternică dovadă pe care o avem, dar câteva rezerve cinstite înainte să te bazezi prea mult pe el:

  • CV-urile erau în context SUA (LiveCareer.com). CV-urile în context UE includ fotografii, date de naștere, câmpuri relevante pentru GDPR și ordonări de secțiuni specifice localei. Mecanismul bias-ului (perplexitate-ca-familiaritate) ar trebui să se generalizeze, dar mărimea efectului pentru recrutarea europeană încă nu a fost măsurată.
  • Sarcinile de triere testate au fost comparații pereche și clasificare de listă scurtă. Sistemele ATS de producție combină adesea scoring-ul LLM cu filtre de cuvinte-cheie, întrebări de eliminare și criterii ponderate — bias-ul LLM este un semnal într-un teanc de semnale.
  • Studiul nu a testat Claude (Anthropic) nici Gemini (Google) — ambele acum folosite în producție la scară pentru triere. Direcția bias-ului ar trebui să fie aceeași (modelele preferă propriile ieșiri), dar magnitudinile pentru acele sisteme specifice nu sunt în acest set de date.
  • Bias-ul de auto-preferință este unul printre multe bias-uri pe care LLM-urile le manifestă la trierea CV-urilor. Bias-ul demografic față de femei, minorități și candidați mai în vârstă persistă în multe modele — acea problemă este mai veche și mai bine documentată, și nu dispare doar pentru că avem acum o problemă nouă de AI-contra-AI.
  • Atenuarea (vot majoritar cu modele mici) reduce bias-ul cu >50% dar nu-l elimină. Nu există în prezent nicio tehnică care să elimine complet bias-ul de auto-preferință.

Folosește AI pe CV fără să cazi în capcana auto-preferinței (6 pași)

  1. 1

    Redactează-ți mai întâi propria substanță

    Deschide un document gol și notează faptele: roluri, date, nume de angajatori, nume de proiecte, trei până la cinci realizări reale per rol cu numere dacă le ai. Fă asta ÎNAINTE să deschizi vreun instrument AI. Stratul faptic trebuie să vină din memoria ta, nu din presupunerea unui model.

  2. 2

    Folosește AI pentru formulare, nu pentru conținut

    Lipește câte un bullet odată în LLM-ul tău ales și cere: „Rescrie acest bullet să fie mai concis și mai impactant, păstrând tot conținutul faptic intact." Respinge orice ieșire care adaugă un număr, o metrică sau o afirmație pe care nu ai furnizat-o. Dacă AI inventează lucruri, schimbă instrumentul.

  3. 3

    Mixează surse pentru a dilua amprentele unui singur model

    Dacă ai folosit ChatGPT pentru a lustrui secțiunea de experiență, treci secțiunea de educație printr-un instrument diferit (Claude, Gemini, DeepSeek) — sau editează de mână. Bias-ul de auto-preferință se declanșează doar când întregul CV se citește ca ieșirea de semnătură a unui model.

  4. 4

    Editează ieșirea AI de mână

    Citește fiecare frază sugerată de AI cu voce tare. Dacă sună robotică, schimbă unul sau două cuvinte să se potrivească cu vocea ta naturală. Înlocuiește orice „orientat spre rezultate", „pasiune pentru excelență", „a sinergiza" sau „a valorifica" cu cuvintele pe care le-ai folosi tu cu adevărat. Vocea supraviețuiește lustruitului.

  5. 5

    Rulează o verificare ATS înainte să trimiți

    Orice AI ai folosit, verificarea structurală ATS (o singură coloană, text real selectabil, etichete standard de secțiune, fără fotografii decorative în antet) contează în continuare. Filtrele de cuvinte-cheie ATS și parsarea secțiunilor rulează independent de trierea LLM — fișierul tău trebuie să treacă ambele straturi.

  6. 6

    Declară dacă aplicația cere

    Un număr tot mai mare de angajatori UE — în special în finanțe, sănătate, administrație publică și academie — întreabă explicit dacă a fost folosit AI. Dacă aplicația întreabă, răspunde cinstit. A spune „da, AI a fost folosit pentru a lustrui formularea, toate faptele și realizările au fost scrise de mine" este un răspuns apărabil și tot mai așteptat.

Întrebări frecvente

Ar trebui să folosesc ChatGPT sau alte LLM-uri să-mi scriu CV-ul în 2026?

Folosește-le pentru a lustrui formularea, nu pentru a-ți scrie conținutul faptic. Studiul lui Xu/Li/Jiang (2025) arată că filtrele LLM dau un avantaj de listă scurtă de 23-60% candidaților care au folosit același model ca filtrul — dar doar dacă scrierea se citește efectiv ca ieșire a acelui model. Un CV unde tu ai scris substanța și o AI a lustruit bullet-uri individuale obține majoritatea avantajului fără să sune robotic pentru evaluatorii umani.

Înseamnă că ar trebui să folosesc același instrument AI ca angajatorul?

Dacă ai ști ce model folosește ATS-ul angajatorului, potrivirea l-ar maximiza bias-ul în favoarea ta. În practică aproape niciodată nu știi. GPT-4o este modelul de triere corporativ cel mai larg desfășurat, deci lustruitul cu GPT-4o este pariul cu cea mai mare probabilitate pentru aplicații la corporații mari — dar doar ca lustruit, nu ca redactare. Pentru companii mici cu evaluatori umani, pariul mai sigur este utilizarea minimă a AI.

Sunt recrutorii și angajatorii conștienți de acest bias?

Din ce în ce mai mult da, în special în companiile UE care se pregătesc pentru clasificarea de risc ridicat pentru recrutare a AI Act. Unii atenuează cu ansambluri cu vot majoritar (combinând un LLM principal cu modele mai mici pentru decizii de listă scurtă) care reduc bias-ul cu peste 50%. Majoritatea companiilor mai mici care folosesc produse ATS de pe raft nu sunt conștiente și nu au atenuări implementate.

Poate un recrutor uman să identifice proza unui CV scris de AI?

Recrutorii cu experiență pot identifica proza AI a unui singur model în 5-10 secunde de citit. Semnele: fraze tip ca „orientat spre rezultate", „pasiune pentru excelență", „a sinergiza", „a valorifica"; lungime de frază suspect de uniformă; structură de bullet-uri prea simetrică; realizări vagi fără numere reale. Lustruitul AI care îți păstrează ritmul frazei și înlocuiește frazele tip cu propriile tale cuvinte evită detectarea în mare parte.

Este necinstit să folosești AI pe CV-ul tău?

A folosi AI pentru a lustrui formularea este practică standard în industrie și nu este în sine necinstit. A folosi AI pentru a fabrica realizări, a inventa metrici sau a pretinde experiență pe care nu o ai ESTE necinstit și este motiv să i se retragă orice ofertă rezultată. Linia trece între formulare (acceptabil) și substanță (inacceptabil). Majoritatea ghidurilor etice în curs de dezvoltare în instituțiile UE urmează aceeași linie.

Care este diferența între bias-ul de auto-preferință și bias-ul demografic în AI de recrutare?

Bias-ul demografic înseamnă că AI tratează candidații diferit pe baza unor caracteristici protejate ca gen, rasă sau vârstă — bine documentat din 2018, combătut activ legislativ în AI Act UE și în mai multe jurisdicții din SUA. Bias-ul de auto-preferință înseamnă că AI tratează candidații diferit pe baza dacă au folosit aceeași marcă AI ca filtrul — măsurat pentru prima dată la scară de Xu, Li & Jiang (2025), și în prezent nereglementat de nicio reglementare de echitate AI. Ambele bias-uri pot coexista în același sistem de triere.

Unde pot citi cercetarea originală?

Articolul este „AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights" de Jiannan Xu, Gujie Li și Jane Yi Jiang. Preprintul este deschis disponibil la arXiv:2509.00462 (2025). Versiuni nearhivate au fost prezentate la ACM EAAMO 2025 și AIES 2025 (DOI 10.1145/3757887.3767676). Versiunea arXiv este actualizată mai frecvent și este sursa primară recomandată.

Va deveni acest bias mai rău în timp?

Două forțe opuse. Mai rău: pe măsură ce mai mulți candidați folosesc AI pentru a scrie CV-uri, proporția de text fluent AI în pool-ul de triere crește, iar bias-ul față de minoritatea scrisă de mână care se micșorează devine mai pronunțat. Mai bine: pe măsură ce cercetătorii publică mai multe descoperiri ca aceasta, furnizorii ATS conștienți de echitate și regulatorii UE recuperează. Direcția netă în următorii 2-3 ani este incertă. Pariul sigur este să presupui că bias-ul persistă și să folosești strategia de lustruit-nu-redactat oricum.

Este CV-ul tău pregătit pentru ATS?

Primești instant un scor de compatibilitate ATS și vezi exact ce să corectezi — gratuit.

Verifică-mi CV-ul

Ghiduri similare