Gemini 3 Flash, një model i avancuar i inteligjencës artificiale, është i njohur për shpejtësinë dhe aftësitë e tij të larta.
Megjithatë, sipas një vlerësimi të një grupi të pavarur testues, nëse i bëhet një pyetje për diçka që ai nuk e di – për shembull, diçka komplekse, të pazakontë ose jashtë njohurive të tij – modeli pothuajse gjithmonë përpiqet të japë një përgjigje, shpesh duke shpikur ose trilluar informacionin.
Në testet e “shkallës së halucinimeve” (hallucination rate) në benchmark‑in AA‑Omniscience, Gemini 3 Flash regjistroi një normë prej 91 për qind. Kjo do të thotë se, edhe kur nuk kishte një përgjigje të saktë, modeli dha një përgjigje, shpesh krejtësisht të trilluar.
Ky fenomen i “shpikjes së përgjigjeve” është një problem i njohur te modelet e gjenerimit të tekstit. Sipas testit, Gemini nuk e menaxhon mirë situatën kur përgjigjja e saktë do të ishte “nuk e di”.
Megjithatë, kjo shifër nuk nënkupton se 91 për qind e përgjigjeve të tij janë të gabuara; ajo tregon vetëm se sa shpesh modeli shpik diçka kur nuk ka një përgjigje reale.
Pavarësisht këtij problemi, Gemini 3 Flash mbetet shumë i fuqishëm dhe performon mirë në testet e përgjithshme, megjithëse vetëbesimi i tepërt në situata të pasigurta mund të përbëjë sfidë në përdorime serioze.
























