heise+ | Large Language Models testen mit EVALs (opens in new tab)
Warum das Testen von LLMs schwer ist: Sie sind nicht deterministisch. Gleicher Input kann unterschiedliche, teils faktisch falsche Outputs erzeugen.
Read the original articleWarum das Testen von LLMs schwer ist: Sie sind nicht deterministisch. Gleicher Input kann unterschiedliche, teils faktisch falsche Outputs erzeugen.
Read the original article