+1 pentru "inginerie de context" față de "inginerie promptă". Oamenii asociază solicitările cu descrieri scurte ale sarcinilor pe care le-ai da unui LLM în utilizarea ta de zi cu zi. Când în fiecare aplicație LLM de putere industrială, ingineria contextului este arta delicată și știința de a umple fereastra contextului cu informațiile potrivite pentru pasul următor. Știință, deoarece a face acest lucru corect implică descrieri și explicații ale sarcinilor, câteva exemple de fotografii, RAG, date conexe (posibil multimodale), instrumente, stare și istorie, compactare... Prea puțin sau de forma greșită, iar LLM nu are contextul potrivit pentru performanțe optime. Prea mult sau prea irelevant și costurile LLM ar putea crește și performanța ar putea scădea. A face acest lucru bine nu este trivial. Și arta datorită intuiției călăuzitoare în jurul psihologiei LLM a spiritelor oamenilor. Pe lângă ingineria contextului în sine, o aplicație LLM trebuie: - împărțirea problemelor direct în fluxuri de control - Împachetați ferestrele contextuale corect - expedierea apelurilor către LLM-uri de tipul și capacitatea potrivite - gestionarea fluxurilor UIUX de verificare a generării - mult mai mult - bariere de protecție, securitate, evaluări, paralelism, preluare, ... Deci, ingineria contextului este doar o mică parte dintr-un strat gros emergent de software non-trivial care coordonează apelurile LLM individuale (și multe altele) în aplicații LLM complete. Termenul "ChatGPT wrapper" este obosit și foarte, foarte greșit.
tobi lutke
tobi lutke19 iun. 2025
Îmi place foarte mult termenul "inginerie de context" în detrimentul ingineriei prompte. Descrie mai bine abilitatea de bază: arta de a oferi tot contextul pentru ca sarcina să fie rezolvabilă în mod plauzibil de către LLM.
1,89M