Wir senken den Preis von o3 um 80 % und führen o3-pro in der API ein, das noch mehr Rechenleistung nutzt. o3: Eingang: 2 $ / 1M Tokens Ausgang: 8 $ / 1M Tokens Jetzt in Kraft. Wir haben unseren Inferenz-Stack optimiert, der o3 bedient. Das gleiche Modell – nur günstiger.
o3-pro: Eingabe: 20 $ / 1M Token Ausgabe: 80 $ / 1M Token (87 % günstiger als o1-pro!) Wir empfehlen die Verwendung des Hintergrundmodus mit o3-pro: Langlaufende Aufgaben werden asynchron gestartet, um Zeitüberschreitungen zu vermeiden.
359,87K