-
chat_history – Eine Liste früherer Nachrichten zwischen dem Benutzer und dem Modell, die dem Modell einen Konversationskontext für die Beantwortung der Nachricht des Benutzers geben soll.
Die folgenden Felder sind erforderlich.
Im Folgenden sehen Sie ein JSON-Beispiel für das Feld chat_history.
"chat_history": [
{"role": "USER", "message": "Who discovered gravity?"},
{"role": "CHATBOT", "message": "The man who is widely credited with discovering gravity is Sir Isaac Newton"}
]
-
documents – Eine Liste von Texten, die das Modell zitieren kann, um eine genauere Antwort zu generieren. Jedes Dokument ist ein Wörterbuch mit Zeichenfolgen. Die daraus resultierende Generierung umfasst Zitate, die auf einige dieser Dokumente verweisen. Wir empfehlen, die Gesamtzahl der Wörter der Zeichenfolgen im Wörterbuch auf weniger als 300 Wörter zu beschränken. Optional kann ein _excludes-Feld (ein Array von Zeichenfolgen) angegeben werden, um zu verhindern, dass einige Schlüssel-Wert-Paare dem Modell angezeigt werden. Weitere Informationen finden Sie unter Leitfaden für Dokumentenmodi in der Cohere-Dokumentation.
Im Folgenden sehen Sie ein JSON-Beispiel für das Feld documents.
"documents": [
{"title": "Tall penguins", "snippet": "Emperor penguins are the tallest."},
{"title": "Penguin habitats", "snippet": "Emperor penguins only live in Antarctica."}
]
-
search_queries_only – Die Standardeinstellung ist false. Wenn true gilt, enthält die Antwort nur eine Liste generierter Suchabfragen, es findet jedoch keine Suche statt und es wird keine Antwort des Modells auf die message des Benutzers generiert.
-
preamble – Setzt die Standardpräambel für die Generierung von Suchabfragen außer Kraft. Dies hat keinen Einfluss auf die Generationen der Tool-Nutzung.
-
max_tokens – Die maximale Anzahl von Token, die das Modell als Teil der Antwort generieren sollte. Beachten Sie, dass die Festlegung eines niedrigen Werts zu unvollständigen Generierungen führen kann. Die Einstellung max_tokens kann zu unvollständigen oder gar keinen Generierungen führen, wenn sie zusammen mit dem Feld tools oder documents verwendet wird.
-
Temperatur – Verwenden Sie einen niedrigeren Wert, um die Zufälligkeit der Antwort zu verringern. Die Zufälligkeit kann weiter maximiert werden, indem der Wert des p-Parameters erhöht wird.
| Standard |
Minimum |
Maximum |
|
0.3
|
0
|
1
|
-
p – Verwenden Sie einen niedrigeren Wert, um weniger wahrscheinliche Optionen zu ignorieren.
| Standard |
Minimum |
Maximum |
|
0.75
|
0.01
|
0.99
|
-
k – Geben Sie die Anzahl der Token-Optionen an, die das Modell zur Generierung des nächsten Tokens verwendet.
| Standard |
Minimum |
Maximum |
|
0
|
0
|
500
|
-
prompt_truncation – Die Standardeinstellung ist OFF. Legt fest, wie der Prompt aufgebaut ist. Bei Einstellung von prompt_truncation auf AUTO_PRESERVE_ORDER werden einige Elemente von chat_history und documents gelöscht, um einen Prompt zu erstellen, der innerhalb der Kontext-Längenbeschränkung des Modells liegt. Während dieses Vorgangs werden die Reihenfolge der Dokumente und der Chat-Verlauf beibehalten. Wenn prompt_truncation auf OFF festgelegt ist, werden keine Elemente gelöscht.
-
frequency_penalty – Wird verwendet, um die Wiederholbarkeit generierter Token zu reduzieren. Je höher der Wert ist, umso stärker ist die für zuvor bereits vorhandene Token angewendete Penalty, proportional dazu, wie oft sie bereits in dem Prompt oder der vorherigen Generierung aufgetreten sind.
| Standard |
Minimum |
Maximum |
|
0
|
0
|
1
|
-
presence_penalty – Wird verwendet, um die Wiederholbarkeit generierter Token zu reduzieren. Ähnlich wie frequency_penalty nur mit dem Unterschied, dass diese Strafe gleichmäßig auf alle Token angewendet wird, die bereits erschienen sind, unabhängig von ihrer genauen Häufigkeit.
| Standard |
Minimum |
Maximum |
|
0
|
0
|
1
|
-
seed – Falls angegeben, bemüht sich das Backend nach besten Kräften, Token deterministisch zu testen, sodass wiederholte Anfragen mit demselben Startwert und denselben Parametern dasselbe Ergebnis liefern sollten. Determinismus kann jedoch nicht vollständig garantiert werden.
-
return_prompt – Geben Sie true an, damit der vollständige Prompt zurückgegeben wird, der an das Modell gesendet wurde. Der Standardwert ist false. In der Antwort ist dies der Prompt im Feld prompt.
-
tools – Eine Liste verfügbarer Tools (Funktionen), deren Aufruf das Modell möglicherweise vorschlägt, bevor eine Textantwort generiert wird. Wenn tools (ohne tool_results) übergeben wird, lautet das Feld text in der Antwort "" und das Feld tool_calls in der Antwort wird mit einer Liste von Tool-Aufrufen gefüllt, die getätigt werden müssen. Wenn keine Aufrufe getätigt werden müssen, ist das tool_calls-Array leer.
Weitere Informationen finden Sie unter Tool-Nutzung in der Cohere-Dokumentation.
Im Folgenden sehen Sie ein JSON-Beispiel für das Feld tools.
[
{
"name": "top_song",
"description": "Get the most popular song played on a radio station.",
"parameter_definitions": {
"sign": {
"description": "The call sign for the radio station for which you want the most popular song. Example calls signs are WZPZ and WKRP.",
"type": "str",
"required": true
}
}
}
]
Weitere Informationen finden Sie in der Cohere Dokumentation unter Verwendung von Single-Step Tools (Funktionsaufruf).
-
tools_results – Eine Liste der Ergebnisse des Aufrufs von Tools, die vom Modell in der vorherigen Chatrunde empfohlen wurden. Die Ergebnisse werden verwendet, um eine Textantwort zu erstellen, und in Quellenangaben wird auf sie verwiesen. Bei der Verwendung von tool_results muss tools ebenfalls übergeben werden. Jedes tool_result enthält Informationen darüber, wie es aufgerufen wurde, sowie eine Liste von Ausgaben in Form von Wörterbüchern. Die einzigartige differenzierte Zitierlogik von Cohere erfordert, dass es sich bei der Ausgabe um eine Liste handelt. Falls es sich bei der Ausgabe beispielsweise nur um ein Element handelt, sollten Sie es trotzdem in eine Liste {"status": 200} einbinden.
Weitere Informationen finden Sie unter Tool-Nutzung in der Cohere-Dokumentation.
Im Folgenden sehen Sie ein JSON-Beispiel für das Feld tools_results.
[
{
"call": {
"name": "top_song",
"parameters": {
"sign": "WZPZ"
}
},
"outputs": [
{
"song": "Elemental Hotel"
}
]
}
]
-
stop_sequences – Eine Liste von Stoppsequenzen. Nachdem eine Stoppsequenz erkannt wird, stoppt das Modell die Generierung weiterer Token.
-
raw_prompting – Geben Sie true an, um die message des Benutzers ohne Vorverarbeitung an das Modell zu senden, andernfalls lautet der Wert falsch.