TabbyML · yan91083 · Oct 26, 2023 · Oct 31, 2023 · Oct 31, 2023 · Nov 2, 2023
diff --git a/experimental/eval/analyze.py b/experimental/eval/analyze.py
@@ -0,0 +1,74 @@
+import json
+import sys
+from eval_utils import postprocess_code_lines, remove_comments
+from tree_sitter import Language, Parser
+
+def analyze(model, language, file):
+
+    lang_path = f"build/{language}-lang-parser.so"
+
+    line_match = 0
+    statement_match = 0
+    parser = Parser()
+    if language == "csharp":
+        parser_language = Language(lang_path, "c_sharp")
+    else:
+        parser_language = Language(lang_path, language)
+    parser.set_language(parser_language)
+
+    input_file = f"./data/{model}/{language}/{file}"
+    output_file = f"./data/{model}/{language}/result_{file}"
+
+    with open(output_file, 'w') as fout:
+        with open(input_file) as fin:
+            for line in fin:
+                obj = json.loads(line)
+                result = {}
+                prediction = ""
+
+                for k in obj.keys():
+                    if k == "prediction":
+                        prediction = str(obj[k])
+                        break
+                    elif k == "error":
+                        break
+                    else:
+                        result[k] = obj[k]
+
+                tabby_eval = {}
+                if file == "line_completion.jsonl":
+                    tabby_eval["raw_prompt"] = obj["prompt"]
+                else:
+                    tabby_eval["raw_prompt"] = obj["crossfile_context"]["text"] + obj["prompt"]
+
+                tabby_eval["prediction"] = prediction
+
+                groundtruth = obj["groundtruth"]
+
+                tabby_eval["first_line_prediction"] = prediction.split("\n")[0]
+                tabby_eval["first_line_groundtruth"] = groundtruth.split("\n")[0]
+                if tabby_eval["first_line_prediction"] == tabby_eval["first_line_groundtruth"]:
+                    tabby_eval["first_line_matched"] = True
+                    line_match += 1
+                else:
+                    tabby_eval["first_line_matched"] = False
+
+                tabby_eval["first_statement_prediction"] = postprocess_code_lines(tabby_eval["raw_prompt"], prediction, parser, language)
+                tabby_eval["first_statement_groundtruth"] = postprocess_code_lines(tabby_eval["raw_prompt"], groundtruth, parser, language)
+                if tabby_eval["first_statement_prediction"] == tabby_eval["first_statement_groundtruth"]:
+                    tabby_eval["first_statement_matched"] = True
+                    statement_match += 1
+                else:
+                    tabby_eval["first_statement_matched"] = False
+
+                result["tabby_eval"] = tabby_eval
+
+                json.dump(result, fout)
+                fout.write("\n")
+
+    print(f"first line matched: {line_match}")
+    print(f"first statement matched: {statement_match}")
+
+
+analyze(sys.argv[1], sys.argv[2], sys.argv[3])
+
diff --git a/experimental/eval/build/csharp-lang-parser.so b/experimental/eval/build/csharp-lang-parser.so
diff --git a/experimental/eval/build/java-lang-parser.so b/experimental/eval/build/java-lang-parser.so
diff --git a/experimental/eval/build/python-lang-parser.so b/experimental/eval/build/python-lang-parser.so
diff --git a/experimental/eval/build/typescript-lang-parser.so b/experimental/eval/build/typescript-lang-parser.so
diff --git a/experimental/eval/build_treesitter.sh b/experimental/eval/build_treesitter.sh
@@ -0,0 +1,10 @@
+mkdir ts_package;
+cd ts_package;
+# Download the tree-sitter package
+git clone https://github.com/tree-sitter/tree-sitter-python.git;
+git clone https://github.com/tree-sitter/tree-sitter-java.git;
+git clone https://github.com/tree-sitter/tree-sitter-c-sharp.git;
+git clone https://github.com/tree-sitter/tree-sitter-typescript.git;
+cd ..;
+# Build tree-sitter
+python build_ts_lib.py
diff --git a/experimental/eval/build_ts_lib.py b/experimental/eval/build_ts_lib.py
@@ -0,0 +1,18 @@
+#!/usr/bin/env python
+# coding=utf-8
+# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
+
+from tree_sitter import Language
+
+def build_language_lib():
+    for lang in ["java", "python", "typescript", "csharp"]:
+        ts_lang = "c-sharp" if lang == "csharp" else lang
+        if lang == "typescript":
+            git_dir = f"ts_package/tree-sitter-{ts_lang}/{lang}"
+        else:
+            git_dir = f"ts_package/tree-sitter-{ts_lang}"
+        Language.build_library(f'build/{lang}-lang-parser.so', [git_dir])
+
+
+if __name__ == "__main__":
+    build_language_lib()
diff --git a/experimental/eval/data/CodeLlama-13B/csharp/line_completion.jsonl b/experimental/eval/data/CodeLlama-13B/csharp/line_completion.jsonl
diff --git a/experimental/eval/data/CodeLlama-13B/csharp/line_completion_oracle_bm25.jsonl b/experimental/eval/data/CodeLlama-13B/csharp/line_completion_oracle_bm25.jsonl
diff --git a/experimental/eval/data/CodeLlama-13B/csharp/line_completion_rg1_bm25.jsonl b/experimental/eval/data/CodeLlama-13B/csharp/line_completion_rg1_bm25.jsonl
diff --git a/experimental/eval/data/CodeLlama-13B/csharp/result_line_completion.jsonl b/experimental/eval/data/CodeLlama-13B/csharp/result_line_completion.jsonl
diff --git a/experimental/eval/data/CodeLlama-13B/csharp/result_line_completion_oracle_bm25.jsonl b/experimental/eval/data/CodeLlama-13B/csharp/result_line_completion_oracle_bm25.jsonl
diff --git a/experimental/eval/data/CodeLlama-13B/csharp/result_line_completion_rg1_bm25.jsonl b/experimental/eval/data/CodeLlama-13B/csharp/result_line_completion_rg1_bm25.jsonl
diff --git a/experimental/eval/data/CodeLlama-7B/csharp/line_completion.jsonl b/experimental/eval/data/CodeLlama-7B/csharp/line_completion.jsonl
diff --git a/experimental/eval/data/CodeLlama-7B/csharp/line_completion_oracle_bm25.jsonl b/experimental/eval/data/CodeLlama-7B/csharp/line_completion_oracle_bm25.jsonl
diff --git a/experimental/eval/data/CodeLlama-7B/csharp/line_completion_rg1_bm25.jsonl b/experimental/eval/data/CodeLlama-7B/csharp/line_completion_rg1_bm25.jsonl
diff --git a/experimental/eval/data/CodeLlama-7B/csharp/result_line_completion.jsonl b/experimental/eval/data/CodeLlama-7B/csharp/result_line_completion.jsonl
diff --git a/experimental/eval/data/CodeLlama-7B/csharp/result_line_completion_oracle_bm25.jsonl b/experimental/eval/data/CodeLlama-7B/csharp/result_line_completion_oracle_bm25.jsonl
diff --git a/experimental/eval/data/CodeLlama-7B/csharp/result_line_completion_rg1_bm25.jsonl b/experimental/eval/data/CodeLlama-7B/csharp/result_line_completion_rg1_bm25.jsonl
diff --git a/experimental/eval/data/StarCoder-1B/Python/line_completion.jsonl b/experimental/eval/data/StarCoder-1B/Python/line_completion.jsonl