CycloneDX
diff --git a/‎contrib/fine-tuning/.gitignore‎
Lines changed: 2 additions & 0 deletions b/‎contrib/fine-tuning/.gitignore‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎contrib/fine-tuning/Modelfile-mini‎
Lines changed: 10 additions & 0 deletions b/‎contrib/fine-tuning/Modelfile-mini‎
Lines changed: 10 additions & 0 deletions
diff --git a/‎contrib/fine-tuning/convert-gguf.sh‎
Lines changed: 76 additions & 49 deletions b/‎contrib/fine-tuning/convert-gguf.sh‎
Lines changed: 76 additions & 49 deletions
diff --git a/‎contrib/fine-tuning/fine-tune-mlx.sh‎
Lines changed: 38 additions & 15 deletions b/‎contrib/fine-tuning/fine-tune-mlx.sh‎
Lines changed: 38 additions & 15 deletions
diff --git a/‎contrib/fine-tuning/upload-hf.sh‎
Lines changed: 6 additions & 3 deletions b/‎contrib/fine-tuning/upload-hf.sh‎
Lines changed: 6 additions & 3 deletions
diff --git a/‎contrib/xBOMEval/README.md‎
Lines changed: 4 additions & 0 deletions b/‎contrib/xBOMEval/README.md‎
Lines changed: 4 additions & 0 deletions
@@ -1,5 +1,7 @@
 dataset/
 adapters/
+adapters-mini/
 out.txt
 unsloth/
 CycloneDX/
+Qwen/
@@ -0,0 +1,10 @@
+FROM ./cdx1-mini-4B-q8_0.gguf
+
+PARAMETER num_ctx 16000
+PARAMETER temperature 0.7
+
+SYSTEM """You are a helpful assistant to the user."""
+
+LICENSE """
+apache-2.0
+"""
@@ -17,12 +17,21 @@ set -e
 # cmake --build build --config Release -j $(sysctl -n hw.logicalcpu)
 
 export TOKENIZERS_PARALLELISM=false
+LLAMA_CPP_PATH=/Users/appthreat/work/llama.cpp
+cd $LLAMA_CPP_PATH
+source .venv/bin/activate
+CDXGEN_FT_PATH=/Users/appthreat/work/cdxgen/contrib/fine-tuning
 
 TUNING_TOOL=mlx
 FORMAT=GGUF
 HF_ORG=CycloneDX
 TOOL_BASE_MODEL=${1:-cdx1}
+MODEL_FILE_PATH=${CDXGEN_FT_PATH}/Modelfile
 case "$TOOL_BASE_MODEL" in
+  cdx1-mini)
+    PARAM_SIZE="4B"
+    MODEL_FILE_PATH=${CDXGEN_FT_PATH}/Modelfile-mini
+    ;;
   cdx1-pro)
     PARAM_SIZE="30B"
     ;;
@@ -33,10 +42,6 @@ case "$TOOL_BASE_MODEL" in
     PARAM_SIZE="gguf"
     ;;
 esac
-LLAMA_CPP_PATH=/Users/appthreat/work/llama.cpp
-cd $LLAMA_CPP_PATH
-source .venv/bin/activate
-CDXGEN_FT_PATH=/Users/appthreat/work/cdxgen/contrib/fine-tuning
 
 GGUF_MODEL_Q8_0_NAME=${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q8_0-${FORMAT}
 GGUF_MODEL_Q8_0_PATH=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q8_0-${FORMAT}
@@ -45,44 +50,55 @@ FUSED_MODEL=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${TUNING_TOOL}
 rm -rf ${GGUF_MODEL_Q8_0_PATH}
 mkdir -p ${GGUF_MODEL_Q8_0_PATH}
 python convert_hf_to_gguf.py --outtype q8_0 --outfile ${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q8_0-${FORMAT}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-q8_0.gguf --model-name ${GGUF_MODEL_Q8_0_NAME} ${FUSED_MODEL}
-cp ${CDXGEN_FT_PATH}/Modelfile ${GGUF_MODEL_Q8_0_PATH}/
+cp ${MODEL_FILE_PATH} ${GGUF_MODEL_Q8_0_PATH}/Modelfile
 cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_Q8_0_PATH}/
 
 GGUF_MODEL_BF16_NAME=${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}
 GGUF_MODEL_BF16_PATH=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}
 rm -rf ${GGUF_MODEL_BF16_PATH}
 mkdir -p ${GGUF_MODEL_BF16_PATH}
 python convert_hf_to_gguf.py --outtype bf16 --outfile ${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-bf16.gguf --model-name ${GGUF_MODEL_BF16_NAME} ${FUSED_MODEL}
-cp ${CDXGEN_FT_PATH}/Modelfile ${GGUF_MODEL_BF16_PATH}/
+cp ${MODEL_FILE_PATH} ${GGUF_MODEL_BF16_PATH}/Modelfile
 sed -i '' 's|./cdx1-${PARAM_SIZE}-q8_0.gguf|./cdx1-${PARAM_SIZE}-bf16.gguf|g' ${GGUF_MODEL_BF16_PATH}/Modelfile
 cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_BF16_PATH}/
 
-GGUF_MODEL_Q4_K_M_NAME=${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q4_K_M-${FORMAT}
-GGUF_MODEL_Q4_K_M_PATH=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q4_K_M-${FORMAT}
-rm -rf ${GGUF_MODEL_Q4_K_M_PATH}
-mkdir -p ${GGUF_MODEL_Q4_K_M_PATH}
-llama-quantize ${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-bf16.gguf ${GGUF_MODEL_Q4_K_M_PATH}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q4_K_M.gguf Q4_K_M
-cp ${CDXGEN_FT_PATH}/Modelfile ${GGUF_MODEL_Q4_K_M_PATH}/
-sed -i '' 's|./cdx1-${PARAM_SIZE}-q8_0.gguf|./cdx1-${PARAM_SIZE}-Q4_K_M.gguf|g' ${GGUF_MODEL_Q4_K_M_PATH}/Modelfile
-cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_Q4_K_M_PATH}/
-
-GGUF_MODEL_IQ4_NL_NAME=${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-IQ4_NL-${FORMAT}
-GGUF_MODEL_IQ4_NL_PATH=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-IQ4_NL-${FORMAT}
-rm -rf ${GGUF_MODEL_IQ4_NL_PATH}
-mkdir -p ${GGUF_MODEL_IQ4_NL_PATH}
-llama-quantize ${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-bf16.gguf ${GGUF_MODEL_IQ4_NL_PATH}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-IQ4_NL.gguf IQ4_NL
-cp ${CDXGEN_FT_PATH}/Modelfile ${GGUF_MODEL_IQ4_NL_PATH}/
-sed -i '' 's|./cdx1-${PARAM_SIZE}-q8_0.gguf|./cdx1-${PARAM_SIZE}-IQ4_NL.gguf|g' ${GGUF_MODEL_IQ4_NL_PATH}/Modelfile
-cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_IQ4_NL_PATH}/
-
-GGUF_MODEL_Q2_K_NAME=${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q2_K-${FORMAT}
-GGUF_MODEL_Q2_K_PATH=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q2_K-${FORMAT}
-rm -rf ${GGUF_MODEL_Q2_K_PATH}
-mkdir -p ${GGUF_MODEL_Q2_K_PATH}
-llama-quantize ${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-bf16.gguf ${GGUF_MODEL_Q2_K_PATH}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q2_K.gguf Q2_K
-cp ${CDXGEN_FT_PATH}/Modelfile ${GGUF_MODEL_Q2_K_PATH}/
-sed -i '' 's|./cdx1-${PARAM_SIZE}-q8_0.gguf|./cdx1-${PARAM_SIZE}-Q2_K.gguf|g' ${GGUF_MODEL_Q2_K_PATH}/Modelfile
-cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_Q2_K_PATH}/
+if [ "$TOOL_BASE_MODEL" == "cdx1-mini" ]; then
+  GGUF_MODEL_Q6_K_NAME=${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q6_K-${FORMAT}
+  GGUF_MODEL_Q6_K_PATH=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q6_K-${FORMAT}
+  rm -rf ${GGUF_MODEL_Q6_K_PATH}
+  mkdir -p ${GGUF_MODEL_Q6_K_PATH}
+  llama-quantize ${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-bf16.gguf ${GGUF_MODEL_Q6_K_PATH}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q6_K.gguf Q6_K
+  cp ${MODEL_FILE_PATH} ${GGUF_MODEL_Q6_K_PATH}/Modelfile
+  sed -i '' 's|./cdx1-${PARAM_SIZE}-q8_0.gguf|./cdx1-${PARAM_SIZE}-Q6_K.gguf|g' ${GGUF_MODEL_Q6_K_PATH}/Modelfile
+  cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_Q6_K_PATH}/
+else
+  GGUF_MODEL_Q4_K_M_NAME=${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q4_K_M-${FORMAT}
+  GGUF_MODEL_Q4_K_M_PATH=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q4_K_M-${FORMAT}
+  rm -rf ${GGUF_MODEL_Q4_K_M_PATH}
+  mkdir -p ${GGUF_MODEL_Q4_K_M_PATH}
+  llama-quantize ${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-bf16.gguf ${GGUF_MODEL_Q4_K_M_PATH}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q4_K_M.gguf Q4_K_M
+  cp ${MODEL_FILE_PATH} ${GGUF_MODEL_Q4_K_M_PATH}/Modelfile
+  sed -i '' 's|./cdx1-${PARAM_SIZE}-q8_0.gguf|./cdx1-${PARAM_SIZE}-Q4_K_M.gguf|g' ${GGUF_MODEL_Q4_K_M_PATH}/Modelfile
+  cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_Q4_K_M_PATH}/
+
+  GGUF_MODEL_IQ4_NL_NAME=${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-IQ4_NL-${FORMAT}
+  GGUF_MODEL_IQ4_NL_PATH=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-IQ4_NL-${FORMAT}
+  rm -rf ${GGUF_MODEL_IQ4_NL_PATH}
+  mkdir -p ${GGUF_MODEL_IQ4_NL_PATH}
+  llama-quantize ${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-bf16.gguf ${GGUF_MODEL_IQ4_NL_PATH}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-IQ4_NL.gguf IQ4_NL
+  cp ${MODEL_FILE_PATH} ${GGUF_MODEL_IQ4_NL_PATH}/Modelfile
+  sed -i '' 's|./cdx1-${PARAM_SIZE}-q8_0.gguf|./cdx1-${PARAM_SIZE}-IQ4_NL.gguf|g' ${GGUF_MODEL_IQ4_NL_PATH}/Modelfile
+  cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_IQ4_NL_PATH}/
+
+  GGUF_MODEL_Q2_K_NAME=${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q2_K-${FORMAT}
+  GGUF_MODEL_Q2_K_PATH=${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q2_K-${FORMAT}
+  rm -rf ${GGUF_MODEL_Q2_K_PATH}
+  mkdir -p ${GGUF_MODEL_Q2_K_PATH}
+  llama-quantize ${CDXGEN_FT_PATH}/${HF_ORG}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-BF16-${FORMAT}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-bf16.gguf ${GGUF_MODEL_Q2_K_PATH}/${TOOL_BASE_MODEL}-${PARAM_SIZE}-Q2_K.gguf Q2_K
+  cp ${MODEL_FILE_PATH} ${GGUF_MODEL_Q2_K_PATH}/Modelfile
+  sed -i '' 's|./cdx1-${PARAM_SIZE}-q8_0.gguf|./cdx1-${PARAM_SIZE}-Q2_K.gguf|g' ${GGUF_MODEL_Q2_K_PATH}/Modelfile
+  cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_Q2_K_PATH}/
+fi
 
 ### Testing with ollama
 # cd ${GGUF_MODEL_Q8_0_PATH}
@@ -93,30 +109,41 @@ cp ${FUSED_MODEL}/*.json ${FUSED_MODEL}/merges.txt ${GGUF_MODEL_Q2_K_PATH}/
 export HF_HUB_ENABLE_HF_TRANSFER=0
 hf auth whoami
 hf upload --quiet --repo-type model ${GGUF_MODEL_Q8_0_NAME} ${GGUF_MODEL_Q8_0_PATH} .
-hf upload --quiet --repo-type model ${GGUF_MODEL_Q4_K_M_NAME} ${GGUF_MODEL_Q4_K_M_PATH} .
-hf upload --quiet --repo-type model ${GGUF_MODEL_IQ4_NL_NAME} ${GGUF_MODEL_IQ4_NL_PATH} .
-hf upload --quiet --repo-type model ${GGUF_MODEL_Q2_K_NAME} ${GGUF_MODEL_Q2_K_PATH} .
+if [ "$TOOL_BASE_MODEL" == "cdx1-mini" ]; then
+  hf upload --quiet --repo-type model ${GGUF_MODEL_Q6_K_NAME} ${GGUF_MODEL_Q6_K_PATH} .
+else
+  hf upload --quiet --repo-type model ${GGUF_MODEL_Q4_K_M_NAME} ${GGUF_MODEL_Q4_K_M_PATH} .
+  hf upload --quiet --repo-type model ${GGUF_MODEL_IQ4_NL_NAME} ${GGUF_MODEL_IQ4_NL_PATH} .
+  hf upload --quiet --repo-type model ${GGUF_MODEL_Q2_K_NAME} ${GGUF_MODEL_Q2_K_PATH} .
+fi
 hf upload --quiet --repo-type model ${GGUF_MODEL_BF16_NAME} ${GGUF_MODEL_BF16_PATH} .
 
 ollama pull hf.co/${GGUF_MODEL_Q8_0_NAME}
 ollama cp hf.co/${GGUF_MODEL_Q8_0_NAME} ${GGUF_MODEL_Q8_0_NAME}
 ollama push ${GGUF_MODEL_Q8_0_NAME}
 ollama rm hf.co/${GGUF_MODEL_Q8_0_NAME}
 
-ollama pull hf.co/${GGUF_MODEL_Q4_K_M_NAME}
-ollama cp hf.co/${GGUF_MODEL_Q4_K_M_NAME} ${GGUF_MODEL_Q4_K_M_NAME}
-ollama push ${GGUF_MODEL_Q4_K_M_NAME}
-ollama rm hf.co/${GGUF_MODEL_Q4_K_M_NAME}
-
-ollama pull hf.co/${GGUF_MODEL_IQ4_NL_NAME}
-ollama cp hf.co/${GGUF_MODEL_IQ4_NL_NAME} ${GGUF_MODEL_IQ4_NL_NAME}
-ollama push ${GGUF_MODEL_IQ4_NL_NAME}
-ollama rm hf.co/${GGUF_MODEL_IQ4_NL_NAME}
-
-ollama pull hf.co/${GGUF_MODEL_Q2_K_NAME}
-ollama cp hf.co/${GGUF_MODEL_Q2_K_NAME} ${GGUF_MODEL_Q2_K_NAME}
-ollama push ${GGUF_MODEL_Q2_K_NAME}
-ollama rm hf.co/${GGUF_MODEL_Q2_K_NAME}
+if [ "$TOOL_BASE_MODEL" == "cdx1-mini" ]; then
+  ollama pull hf.co/${GGUF_MODEL_Q6_K_NAME}
+  ollama cp hf.co/${GGUF_MODEL_Q6_K_NAME} ${GGUF_MODEL_Q6_K_NAME}
+  ollama push ${GGUF_MODEL_Q6_K_NAME}
+  ollama rm hf.co/${GGUF_MODEL_Q6_K_NAME}
+else
+  ollama pull hf.co/${GGUF_MODEL_Q4_K_M_NAME}
+  ollama cp hf.co/${GGUF_MODEL_Q4_K_M_NAME} ${GGUF_MODEL_Q4_K_M_NAME}
+  ollama push ${GGUF_MODEL_Q4_K_M_NAME}
+  ollama rm hf.co/${GGUF_MODEL_Q4_K_M_NAME}
+
+  ollama pull hf.co/${GGUF_MODEL_IQ4_NL_NAME}
+  ollama cp hf.co/${GGUF_MODEL_IQ4_NL_NAME} ${GGUF_MODEL_IQ4_NL_NAME}
+  ollama push ${GGUF_MODEL_IQ4_NL_NAME}
+  ollama rm hf.co/${GGUF_MODEL_IQ4_NL_NAME}
+
+  ollama pull hf.co/${GGUF_MODEL_Q2_K_NAME}
+  ollama cp hf.co/${GGUF_MODEL_Q2_K_NAME} ${GGUF_MODEL_Q2_K_NAME}
+  ollama push ${GGUF_MODEL_Q2_K_NAME}
+  ollama rm hf.co/${GGUF_MODEL_Q2_K_NAME}
+fi
 
 ollama pull hf.co/${GGUF_MODEL_BF16_NAME}
 ollama cp hf.co/${GGUF_MODEL_BF16_NAME} ${GGUF_MODEL_BF16_NAME}
 
@@ -3,17 +3,26 @@
 set -e
 TUNING_TOOL=mlx
 TOOL_BASE_MODEL=${1:-cdx1}
+MAX_SEQ=262144
+MAX_TOKENS=16384
+ITERS=1500
+NUM_LAYERS=48
 case "$TOOL_BASE_MODEL" in
+  cdx1-mini)
+    NUM_LAYERS=36
+    BASE_MODEL="unsloth/Qwen3-4B-Instruct-2507"
+    ;;
   cdx1-pro)
+    ITERS=2500
     BASE_MODEL="unsloth/Qwen3-Coder-30B-A3B-Instruct"
     ;;
   *)
+    ITERS=2000
     BASE_MODEL="unsloth/Qwen2.5-Coder-14B-Instruct"
     ;;
 esac
 BASE_MODEL_MLX=${BASE_MODEL}-${TUNING_TOOL}
 HF_ORG=CycloneDX
-NUM_LAYERS=16
 ADAPTERS_PATH=adapters
 DATASET_PATH=dataset
 
@@ -38,11 +47,19 @@ node validator.js ${DATASET_PATH}
 
 # This step always pulls the latest base model from HF. Need to think about versioning and checksum to prevent model injection attacks
 echo "Test base model with the prompt 'Tell me about cdxgen'. Usually yields a low-quality response."
-mlx_lm.generate --model ${BASE_MODEL} --prompt "Tell me about cdxgen" --temp 0.05 --max-tokens 32000
+mlx_lm.generate --model ${BASE_MODEL} --prompt "Tell me about cdxgen" --temp 0.7 --max-tokens ${MAX_TOKENS}
 
 # We use LoRA fine-tuning over DoRA due to better compatibility with vLLM and llama.cpp
-echo "Low-Rank Adaptation (LoRA) fine-tuning ${BASE_MODEL} with cdx1 dataset. This might take a while ..."
-mlx_lm.lora --model ${BASE_MODEL} --train --data ${DATASET_PATH} --adapter-path ${ADAPTERS_PATH} --mask-prompt --fine-tune-type lora --batch-size 1 --num-layers ${NUM_LAYERS} --iters 2000 --grad-checkpoint --max-seq-length 16000 --learning-rate "3e-5" --optimizer adam
+if [ "$TOOL_BASE_MODEL" = "cdx1-mini" ]; then
+  echo "Full fine-tune with cdx-docs dataset. This might take a while ..."
+  mlx_lm.lora --model ${BASE_MODEL} --train --data ${DATASET_PATH} --adapter-path ${ADAPTERS_PATH} --mask-prompt --fine-tune-type full --batch-size 2 --num-layers ${NUM_LAYERS} --iters ${ITERS} --grad-checkpoint --max-seq-length ${MAX_SEQ} --learning-rate "1e-5" --optimizer adamw
+elif [ "$TOOL_BASE_MODEL" = "cdx1" ]; then
+  echo "Low-Rank Adaptation (LoRA) fine-tuning ${BASE_MODEL} with cdx-docs dataset. This might take a while ..."
+  mlx_lm.lora --model ${BASE_MODEL} --train --data ${DATASET_PATH} --adapter-path ${ADAPTERS_PATH} --mask-prompt --fine-tune-type lora --batch-size 1 --num-layers ${NUM_LAYERS} --iters ${ITERS} --grad-checkpoint --max-seq-length ${MAX_SEQ} --learning-rate "1e-4" --optimizer adamw
+else
+  echo "Low-Rank Adaptation (LoRA) fine-tuning ${BASE_MODEL} with cdx-docs dataset. This might take a while ..."
+  mlx_lm.lora --model ${BASE_MODEL} --train --data ${DATASET_PATH} --adapter-path ${ADAPTERS_PATH} --mask-prompt --fine-tune-type lora --batch-size 1 --num-layers ${NUM_LAYERS} --iters ${ITERS} --grad-checkpoint --max-seq-length ${MAX_SEQ} --learning-rate "1e-4" --optimizer adamw
+fi
 
 echo "Fuse model to ${FUSED_MODEL} using the cdx1 adapters"
 rm -rf ${FUSED_MODEL}
@@ -51,7 +68,7 @@ rm -rf ${FUSED_MODEL}
 mlx_lm.fuse --model ${BASE_MODEL} --adapter-path adapters --save-path ${FUSED_MODEL} --de-quantize
 
 echo "Test fused model with the prompt 'Tell me about cdxgen'. Must yield a better response."
-mlx_lm.generate --model ./${FUSED_MODEL} --prompt "Tell me about cdxgen" --temp 0.05 --max-tokens 32000
+mlx_lm.generate --model ./${FUSED_MODEL} --prompt "Tell me about cdxgen" --temp 0.7 --max-tokens ${MAX_TOKENS}
 
 rm -rf ${BASE_MODEL_MLX}
 mlx_lm.convert --hf-path ${BASE_MODEL} --mlx-path ${BASE_MODEL_MLX}
@@ -67,19 +84,25 @@ echo "Create quantized models"
 rm -rf ${QUANT_MODEL_8BIT}
 mlx_lm.convert --hf-path ${FUSED_MODEL} --mlx-path ${QUANT_MODEL_8BIT} -q --q-bits 8 --dtype bfloat16
 echo "Test ${QUANT_MODEL_8BIT} with the prompt 'Tell me about cdxgen'. Must yield a better response."
-mlx_lm.generate --model ./${QUANT_MODEL_8BIT} --prompt "Tell me about cdxgen" --temp 0.05 --max-tokens 32000
+mlx_lm.generate --model ./${QUANT_MODEL_8BIT} --prompt "Tell me about cdxgen" --temp 0.7 --max-tokens ${MAX_TOKENS}
 
 rm -rf ${QUANT_MODEL_6BIT}
 mlx_lm.convert --hf-path ${FUSED_MODEL} --mlx-path ${QUANT_MODEL_6BIT} -q --q-bits 6 --dtype bfloat16
 echo "Test ${QUANT_MODEL_6BIT} with the prompt 'Tell me about cdxgen'. Must yield a better response."
-mlx_lm.generate --model ./${QUANT_MODEL_6BIT} --prompt "Tell me about cdxgen" --temp 0.05 --max-tokens 32000
+mlx_lm.generate --model ./${QUANT_MODEL_6BIT} --prompt "Tell me about cdxgen" --temp 0.7 --max-tokens ${MAX_TOKENS}
 
-rm -rf ${QUANT_MODEL_4BIT}
-mlx_lm.convert --hf-path ${FUSED_MODEL} --mlx-path ${QUANT_MODEL_4BIT} -q --q-bits 4 --dtype bfloat16
-echo "Test ${QUANT_MODEL_4BIT} with the prompt 'Tell me about cdxgen'. Must yield a better response."
-mlx_lm.generate --model ./${QUANT_MODEL_4BIT} --prompt "Tell me about cdxgen" --temp 0.05 --max-tokens 32000
+# 4-bit for a small model has very poor performance
+if [ "$TOOL_BASE_MODEL" != "cdx1-mini" ]; then
+  rm -rf ${QUANT_MODEL_4BIT}
+  mlx_lm.convert --hf-path ${FUSED_MODEL} --mlx-path ${QUANT_MODEL_4BIT} -q --q-bits 4 --dtype bfloat16
+  echo "Test ${QUANT_MODEL_4BIT} with the prompt 'Tell me about cdxgen'. Must yield a better response."
+  mlx_lm.generate --model ./${QUANT_MODEL_4BIT} --prompt "Tell me about cdxgen" --temp 0.7 --max-tokens ${MAX_TOKENS}
+fi
 
-#echo "Generating DWQ Quantized model ${DWQ_QUANT_MODEL_4BIT} with the teacher model ${FUSED_MODEL}. This might take several hours ..."
-#mlx_lm.dwq --model ${FUSED_MODEL} --quantized-model ${QUANT_MODEL_8BIT} --mlx-path ${DWQ_QUANT_MODEL_4BIT} --learning-rate "2e-5" --batch-size 1 --data-path dataset --grad-checkpoint
-#echo "Test ${DWQ_QUANT_MODEL_4BIT} with the prompt 'Tell me about cdxgen'. Must yield a better response."
-#mlx_lm.generate --model ./${DWQ_QUANT_MODEL_4BIT} --prompt "Tell me about cdxgen" --temp 0.05 --max-tokens 32000
+#if [ "$TOOL_BASE_MODEL" = "cdx1-mini" ]; then
+#  rm -rf ${DWQ_QUANT_MODEL_4BIT}
+#  echo "Generating DWQ Quantized model ${DWQ_QUANT_MODEL_4BIT} with the teacher model ${FUSED_MODEL}. This might take several hours ..."
+#  mlx_lm.dwq --model ${FUSED_MODEL} --quantized-model ${QUANT_MODEL_8BIT} --mlx-path ${DWQ_QUANT_MODEL_4BIT} --learning-rate "2e-5" --batch-size 1 --data-path dataset --grad-checkpoint
+#  echo "Test ${DWQ_QUANT_MODEL_4BIT} with the prompt 'Tell me about cdxgen'. Must yield a better response."
+#  mlx_lm.generate --model ./${DWQ_QUANT_MODEL_4BIT} --prompt "Tell me about cdxgen" --temp 0.7 --max-tokens ${MAX_TOKENS}
+#fi
@@ -22,7 +22,10 @@ hf upload --quiet --repo-type dataset CycloneDX/cdx-docs ./semantics semantics
 echo "Uploading models. Please wait ..."
 hf upload --quiet --repo-type model ${QUANT_MODEL_8BIT} ./${QUANT_MODEL_8BIT} .
 hf upload --quiet --repo-type model ${QUANT_MODEL_6BIT} ./${QUANT_MODEL_6BIT} .
-hf upload --quiet --repo-type model ${QUANT_MODEL_4BIT} ./${QUANT_MODEL_4BIT} .
-#hf upload --quiet --repo-type model ${DWQ_QUANT_MODEL_4BIT} ./${DWQ_QUANT_MODEL_4BIT} .
-
+if [ "$TOOL_BASE_MODEL" != "cdx1-mini" ]; then
+  hf upload --quiet --repo-type model ${QUANT_MODEL_4BIT} ./${QUANT_MODEL_4BIT} .
+fi
+#if [ "$TOOL_BASE_MODEL" = "cdx1-mini" ]; then
+#  hf upload --quiet --repo-type model ${DWQ_QUANT_MODEL_4BIT} ./${DWQ_QUANT_MODEL_4BIT} .
+#fi
 hf upload --quiet --repo-type model ${FUSED_MODEL} ./${FUSED_MODEL} .
@@ -4,6 +4,8 @@ xBOMEval is a benchmark useful for evaluating LLMs that are optimised for BOM an
 
 Use an appropriate dataset such as [cdx-docs](https://huggingface.co/datasets/CycloneDX/cdx-docs) for training and fine-tuning.
 
+> NOTE: The tests are unreviewed and non-finalised and therefore must be treated as drafts.
+
 ## Categories
 
 The tests include the following categories:
@@ -19,6 +21,8 @@ The tests include the following categories:
 
 System prompt to use Gemini for automated evaluation.
 
+> NOTE: Most LLMs, including Gemini, cannot count the number of entries in a JSON correctly. Plus, the presence of extra quotes and commas can often skew the automated results.
+
 For logic and spec category.
 
 ```text