correct optional fields

ngxson · ngxson · commit 9a9e77100a99 · 2024-05-05T12:10:24.000+02:00
diff --git a/packages/gguf/scripts/generate-llm.ts b/packages/gguf/scripts/generate-llm.ts
@@ -12,35 +12,50 @@ const DEST_COMMON_SOURCE = `
 
 import type { ModelBase, GGUFGeneralInfo } from "./types";
 
-type Attention<TArchitecture extends string> = Record<
-	| \`\${TArchitecture}.attention.head_count\`
-	| \`\${TArchitecture}.attention.head_count_kv\`
-	| \`\${TArchitecture}.attention.layer_norm_epsilon\`
-	| \`\${TArchitecture}.attention.layer_norm_rms_epsilon\`
-	| \`\${TArchitecture}.attention.alibi_bias_max\`
-	| \`\${TArchitecture}.attention.clip_kqv\`
-	| \`\${TArchitecture}.attention.use_norm\`,
+type LLMBase<TArchitecture extends string> = Partial<Record<
+	  \`\${TArchitecture}.vocab_size\`
+	| \`\${TArchitecture}.use_parallel_residual\`
+	| \`\${TArchitecture}.tensor_data_layout\`,
 	number
->;
+>>;
 
-type Rope<TArchitecture extends LLMArchitecture> = Record<
-	| \`\${TArchitecture}.rope.dimension_count\`
-	| \`\${TArchitecture}.rope.freq_base\`
-	| \`\${TArchitecture}.rope.scale\`
-	| \`\${TArchitecture}.rope.scale_linear\`,
+type Attention<TArchitecture extends string> = Record<
+	  \`\${TArchitecture}.attention.head_count\`,
 	number
+> & Partial<Record<
+	  \`\${TArchitecture}.attention.head_count_kv\`
+	| \`\${TArchitecture}.attention.key_length\`
+	| \`\${TArchitecture}.attention.value_length\`,
+	number
+>>;
+
+type RopeScalingType = "none" | "linear" | "yarn";
+type Rope<TArchitecture extends LLMArchitecture> = Partial<
+	Record<
+			\`\${TArchitecture}.rope.dimension_count\`
+		| \`\${TArchitecture}.rope.freq_base\`
+		| \`\${TArchitecture}.rope.scale_linear\`
+		| \`\${TArchitecture}.rope.scaling.factor\`
+		| \`\${TArchitecture}.rope.scaling.original_context_length\`,
+		number
+	>
+	& Record<\`\${TArchitecture}.rope.scaling.type\`, RopeScalingType>
+	& Record<\`\${TArchitecture}.rope.finetuned\`, boolean>
 >;
 
-type MOE<TArchitecture extends LLMArchitecture> = Record<
-	| \`\${TArchitecture}.expert_count\`
-	| \`\${TArchitecture}.expert_used_count\`,
-	number
+type MOE<TArchitecture extends LLMArchitecture> = Partial<
+	Record<
+			\`\${TArchitecture}.expert_count\`
+		| \`\${TArchitecture}.expert_used_count\`,
+		number
+	>
 >;
 
 export type TransformerLLMArchitecture = LLMArchitecture; // type alias
 export type TransformerLLMBase<TArchitecture extends LLMArchitecture> = GGUFGeneralInfo<TArchitecture>
+	& LLMBase<TArchitecture>
 	& ModelBase<TArchitecture>
-	& Partial<MOE<TArchitecture>>
+	& MOE<TArchitecture>
 	& Attention<TArchitecture>
 	& Rope<TArchitecture>;
 
diff --git a/packages/gguf/src/transformer-llm.ts b/packages/gguf/src/transformer-llm.ts
@@ -2,34 +2,46 @@
 
 import type { ModelBase, GGUFGeneralInfo } from "./types";
 
-type Attention<TArchitecture extends string> = Record<
-	| `${TArchitecture}.attention.head_count`
-	| `${TArchitecture}.attention.head_count_kv`
-	| `${TArchitecture}.attention.layer_norm_epsilon`
-	| `${TArchitecture}.attention.layer_norm_rms_epsilon`
-	| `${TArchitecture}.attention.alibi_bias_max`
-	| `${TArchitecture}.attention.clip_kqv`
-	| `${TArchitecture}.attention.use_norm`,
-	number
+type LLMBase<TArchitecture extends string> = Partial<
+	Record<
+		`${TArchitecture}.vocab_size` | `${TArchitecture}.use_parallel_residual` | `${TArchitecture}.tensor_data_layout`,
+		number
+	>
 >;
 
-type Rope<TArchitecture extends LLMArchitecture> = Record<
-	| `${TArchitecture}.rope.dimension_count`
-	| `${TArchitecture}.rope.freq_base`
-	| `${TArchitecture}.rope.scale`
-	| `${TArchitecture}.rope.scale_linear`,
-	number
+type Attention<TArchitecture extends string> = Record<`${TArchitecture}.attention.head_count`, number> &
+	Partial<
+		Record<
+			| `${TArchitecture}.attention.head_count_kv`
+			| `${TArchitecture}.attention.key_length`
+			| `${TArchitecture}.attention.value_length`,
+			number
+		>
+	>;
+
+type RopeScalingType = "none" | "linear" | "yarn";
+type Rope<TArchitecture extends LLMArchitecture> = Partial<
+	Record<
+		| `${TArchitecture}.rope.dimension_count`
+		| `${TArchitecture}.rope.freq_base`
+		| `${TArchitecture}.rope.scale_linear`
+		| `${TArchitecture}.rope.scaling.factor`
+		| `${TArchitecture}.rope.scaling.original_context_length`,
+		number
+	> &
+		Record<`${TArchitecture}.rope.scaling.type`, RopeScalingType> &
+		Record<`${TArchitecture}.rope.finetuned`, boolean>
 >;
 
-type MOE<TArchitecture extends LLMArchitecture> = Record<
-	`${TArchitecture}.expert_count` | `${TArchitecture}.expert_used_count`,
-	number
+type MOE<TArchitecture extends LLMArchitecture> = Partial<
+	Record<`${TArchitecture}.expert_count` | `${TArchitecture}.expert_used_count`, number>
 >;
 
 export type TransformerLLMArchitecture = LLMArchitecture; // type alias
 export type TransformerLLMBase<TArchitecture extends LLMArchitecture> = GGUFGeneralInfo<TArchitecture> &
+	LLMBase<TArchitecture> &
 	ModelBase<TArchitecture> &
-	Partial<MOE<TArchitecture>> &
+	MOE<TArchitecture> &
 	Attention<TArchitecture> &
 	Rope<TArchitecture>;
 
diff --git a/packages/gguf/src/types.ts b/packages/gguf/src/types.ts
@@ -52,7 +52,7 @@ export type Architecture = (typeof ARCHITECTURES)[number];
 
 export interface GGUFGeneralInfo<TArchitecture extends Architecture> {
 	"general.architecture": TArchitecture;
-	"general.name": string;
+	"general.name"?: string;
 	"general.file_type"?: number;
 	"general.quantization_version"?: number;
 }
@@ -63,11 +63,10 @@ export type ModelBase<
 		| `encoder.${Extract<Architecture, "whisper">}`
 		| `decoder.${Extract<Architecture, "whisper">}`,
 > = Record<
-	| `${TArchitecture}.layer_count`
-	| `${TArchitecture}.feed_forward_length`
 	| `${TArchitecture}.context_length`
+	| `${TArchitecture}.block_count`
 	| `${TArchitecture}.embedding_length`
-	| `${TArchitecture}.block_count`,
+	| `${TArchitecture}.feed_forward_length`,
 	number
 >;
 
@@ -82,15 +81,25 @@ interface Tokenizer {
 	"tokenizer.ggml.bos_token_id": number;
 	"tokenizer.ggml.eos_token_id": number;
 	"tokenizer.ggml.add_bos_token": boolean;
-	"tokenizer.chat_template": string;
+	"tokenizer.chat_template"?: string;
 }
 type NoTokenizer = Record<keyof Tokenizer, undefined>;
 
 /// Models outside of llama.cpp: "rwkv" and "whisper"
 
-export type RWKV = GGUFGeneralInfo<"rwkv"> & ModelBase<"rwkv"> & { "rwkv.architecture_version": number };
-
-export type Whisper = GGUFGeneralInfo<"whisper"> & ModelBase<"encoder.whisper"> & ModelBase<"decoder.whisper">;
+export type RWKV = GGUFGeneralInfo<"rwkv"> &
+	ModelBase<"rwkv"> & {
+		"rwkv.architecture_version": number;
+	};
+
+// TODO: whisper.cpp doesn't yet support gguf. This maybe changed in the future.
+export type Whisper = GGUFGeneralInfo<"whisper"> &
+	ModelBase<"encoder.whisper"> &
+	ModelBase<"decoder.whisper"> & {
+		"whisper.encoder.mels_count": number;
+		"whisper.encoder.attention.head_count": number;
+		"whisper.decoder.attention.head_count": number;
+	};
 
 /// Types for parse output