Rename raft-ann-bench module to raft_ann_bench (#2333)

Replace hyphens with underscores in `raft-ann-bench` to make it a valid Python identifier. Also add a Python 3.11 tag to `raft-ann-bench`, and use the `VERSION` file instead of an attribute. Authors: - Kyle Edwards (https://github.com/KyleFromNVIDIA) Approvers: - Divye Gala (https://github.com/divyegala) - Mike Sarahan (https://github.com/msarahan) URL: #2333
rapidsai · May 23, 2024 · 9c8d111 · 9c8d111
1 parent 64827fc
commit 9c8d111
Show file tree

Hide file tree

Showing 48 changed files with 19 additions and 18 deletions.
diff --git a/docs/source/ann_benchmarks_dataset.md b/docs/source/ann_benchmarks_dataset.md
@@ -52,12 +52,12 @@ If you have a dataset, but no corresponding ground truth file, then you can gene
 
 ```bash
 # With existing query file
-python -m raft-ann-bench.generate_groundtruth --dataset /dataset/base.fbin --output=groundtruth_dir --queries=/dataset/query.public.10K.fbin
+python -m raft_ann_bench.generate_groundtruth --dataset /dataset/base.fbin --output=groundtruth_dir --queries=/dataset/query.public.10K.fbin
 
 # With randomly generated queries
-python -m raft-ann-bench.generate_groundtruth --dataset /dataset/base.fbin --output=groundtruth_dir --queries=random --n_queries=10000
+python -m raft_ann_bench.generate_groundtruth --dataset /dataset/base.fbin --output=groundtruth_dir --queries=random --n_queries=10000
 
 # Using only a subset of the dataset. Define queries by randomly
 # selecting vectors from the (subset of the) dataset.
-python -m raft-ann-bench.generate_groundtruth --dataset /dataset/base.fbin --nrows=2000000 --output=groundtruth_dir --queries=random-choice --n_queries=10000
+python -m raft_ann_bench.generate_groundtruth --dataset /dataset/base.fbin --nrows=2000000 --output=groundtruth_dir --queries=random-choice --n_queries=10000
 ```
diff --git a/docs/source/ann_benchmarks_low_level.md b/docs/source/ann_benchmarks_low_level.md
@@ -8,7 +8,7 @@ cd raft
 
 # (1) prepare a dataset
 export PYTHONPATH=python/raft-ann-bench/src:$PYTHONPATH
-python -m raft-ann-bench.get_dataset --dataset glove-100-angular --normalize
+python -m raft_ann_bench.get_dataset --dataset glove-100-angular --normalize
 
 # option --normalize is used here to normalize vectors so cosine distance is converted
 # to inner product; don't use -n for l2 distance

diff --git a/docs/source/raft_ann_benchmarks.md b/docs/source/raft_ann_benchmarks.md
@@ -265,16 +265,16 @@ The steps below demonstrate how to download, install, and run benchmarks on a su
 ```bash
 
 # (1) prepare dataset.
-python -m raft-ann-bench.get_dataset --dataset deep-image-96-angular --normalize
+python -m raft_ann_bench.get_dataset --dataset deep-image-96-angular --normalize
 
 # (2) build and search index
-python -m raft-ann-bench.run --dataset deep-image-96-inner --algorithms raft_cagra --batch-size 10 -k 10
+python -m raft_ann_bench.run --dataset deep-image-96-inner --algorithms raft_cagra --batch-size 10 -k 10
 
 # (3) export data
-python -m raft-ann-bench.data_export --dataset deep-image-96-inner
+python -m raft_ann_bench.data_export --dataset deep-image-96-inner
 
 # (4) plot results
-python -m raft-ann-bench.plot --dataset deep-image-96-inner
+python -m raft_ann_bench.plot --dataset deep-image-96-inner
 ```
 
 Configuration files already exist for the following list of the million-scale datasets. Please refer to [ann-benchmarks datasets](https://github.com/erikbern/ann-benchmarks/#data-sets) for more information, including actual train and sizes. These all work out-of-the-box with the `--dataset` argument. Other million-scale datasets from `ann-benchmarks.com` will work, but will require a json configuration file to be created in `$CONDA_PREFIX/lib/python3.xx/site-packages/raft-ann-bench/run/conf`, or you can specify the `--configuration` option to use a specific file.
@@ -308,20 +308,20 @@ mkdir -p datasets/deep-1B
 # (1) prepare dataset
 # download manually "Ground Truth" file of "Yandex DEEP"
 # suppose the file name is deep_new_groundtruth.public.10K.bin
-python -m raft-ann-bench.split_groundtruth --groundtruth datasets/deep-1B/deep_new_groundtruth.public.10K.bin
+python -m raft_ann_bench.split_groundtruth --groundtruth datasets/deep-1B/deep_new_groundtruth.public.10K.bin
 # two files 'groundtruth.neighbors.ibin' and 'groundtruth.distances.fbin' should be produced
 
 # (2) build and search index
-python -m raft-ann-bench.run --dataset deep-1B --algorithms raft_cagra --batch-size 10 -k 10
+python -m raft_ann_bench.run --dataset deep-1B --algorithms raft_cagra --batch-size 10 -k 10
 
 # (3) export data
-python -m raft-ann-bench.data_export --dataset deep-1B
+python -m raft_ann_bench.data_export --dataset deep-1B
 
 # (4) plot results
-python -m raft-ann-bench.plot --dataset deep-1B
+python -m raft_ann_bench.plot --dataset deep-1B
 ```
 
-The usage of `python -m raft-ann-bench.split_groundtruth` is:
+The usage of `python -m raft_ann_bench.split_groundtruth` is:
 ```bash
 usage: split_groundtruth.py [-h] --groundtruth GROUNDTRUTH
 
@@ -395,7 +395,7 @@ docker run --gpus all --rm -it -u $(id -u)          \
 This will drop you into a command line in the container, with the `raft-ann-bench` python package ready to use, as described in the [Running the benchmarks](#running-the-benchmarks) section above:
 
 ```
-(base) root@00b068fbb862:/data/benchmarks# python -m raft-ann-bench.get_dataset --dataset deep-image-96-angular --normalize
+(base) root@00b068fbb862:/data/benchmarks# python -m raft_ann_bench.get_dataset --dataset deep-image-96-angular --normalize
 ```
 
 Additionally, the containers can be run in detached mode without any issue.

diff --git a/python/raft-ann-bench/pyproject.toml b/python/raft-ann-bench/pyproject.toml
@@ -26,6 +26,7 @@ classifiers = [
     "Programming Language :: Python",
     "Programming Language :: Python :: 3.9",
     "Programming Language :: Python :: 3.10",
+    "Programming Language :: Python :: 3.11",
 ]
 
 [project.urls]
@@ -59,4 +60,4 @@ skip = [
 ]
 
 [tool.setuptools.dynamic]
-version = { attr = "raft-ann-bench.__version__" }
+version = { file = "raft_ann_bench/VERSION" }
diff --git a/...raft-ann-bench/src/raft-ann-bench/VERSION → ...raft-ann-bench/src/raft_ann_bench/VERSION b/...raft-ann-bench/src/raft-ann-bench/VERSION → ...raft-ann-bench/src/raft_ann_bench/VERSION
diff --git a/...-ann-bench/src/raft-ann-bench/__init__.py → ...-ann-bench/src/raft_ann_bench/__init__.py b/...-ann-bench/src/raft-ann-bench/__init__.py → ...-ann-bench/src/raft_ann_bench/__init__.py
diff --git a/...-ann-bench/src/raft-ann-bench/_version.py → ...-ann-bench/src/raft_ann_bench/_version.py b/...-ann-bench/src/raft-ann-bench/_version.py → ...-ann-bench/src/raft_ann_bench/_version.py
diff --git a/...rc/raft-ann-bench/constraints/__init__.py → ...rc/raft_ann_bench/constraints/__init__.py b/...rc/raft-ann-bench/constraints/__init__.py → ...rc/raft_ann_bench/constraints/__init__.py
diff --git a/...rc/raft-ann-bench/data_export/__main__.py → ...rc/raft_ann_bench/data_export/__main__.py b/...rc/raft-ann-bench/data_export/__main__.py → ...rc/raft_ann_bench/data_export/__main__.py
diff --git a/...nn-bench/generate_groundtruth/__main__.py → ...nn_bench/generate_groundtruth/__main__.py b/...nn-bench/generate_groundtruth/__main__.py → ...nn_bench/generate_groundtruth/__main__.py
@@ -96,16 +96,16 @@ def main():
         "The input and output files are in big-ann-benchmark's binary format.",
         epilog="""Example usage
     # With existing query file
-    python -m raft-ann-bench.generate_groundtruth --dataset /dataset/base.\
+    python -m raft_ann_bench.generate_groundtruth --dataset /dataset/base.\
 fbin --output=groundtruth_dir --queries=/dataset/query.public.10K.fbin
 
     # With randomly generated queries
-    python -m raft-ann-bench.generate_groundtruth --dataset /dataset/base.\
+    python -m raft_ann_bench.generate_groundtruth --dataset /dataset/base.\
 fbin --output=groundtruth_dir --queries=random --n_queries=10000
 
     # Using only a subset of the dataset. Define queries by randomly
     # selecting vectors from the (subset of the) dataset.
-    python -m raft-ann-bench.generate_groundtruth --dataset /dataset/base.\
+    python -m raft_ann_bench.generate_groundtruth --dataset /dataset/base.\
 fbin --nrows=2000000 --cols=128 --output=groundtruth_dir \
 --queries=random-choice --n_queries=10000
     """,

diff --git a/...t-ann-bench/generate_groundtruth/utils.py → ...t_ann_bench/generate_groundtruth/utils.py b/...t-ann-bench/generate_groundtruth/utils.py → ...t_ann_bench/generate_groundtruth/utils.py
diff --git a/...rc/raft-ann-bench/get_dataset/__main__.py → ...rc/raft_ann_bench/get_dataset/__main__.py b/...rc/raft-ann-bench/get_dataset/__main__.py → ...rc/raft_ann_bench/get_dataset/__main__.py
diff --git a/...t-ann-bench/get_dataset/fbin_to_f16bin.py → ...t_ann_bench/get_dataset/fbin_to_f16bin.py b/...t-ann-bench/get_dataset/fbin_to_f16bin.py → ...t_ann_bench/get_dataset/fbin_to_f16bin.py
diff --git a/...aft-ann-bench/get_dataset/hdf5_to_fbin.py → ...aft_ann_bench/get_dataset/hdf5_to_fbin.py b/...aft-ann-bench/get_dataset/hdf5_to_fbin.py → ...aft_ann_bench/get_dataset/hdf5_to_fbin.py
diff --git a/...bench/src/raft-ann-bench/plot/__main__.py → ...bench/src/raft_ann_bench/plot/__main__.py b/...bench/src/raft-ann-bench/plot/__main__.py → ...bench/src/raft_ann_bench/plot/__main__.py
diff --git a/...-bench/src/raft-ann-bench/run/__main__.py → ...-bench/src/raft_ann_bench/run/__main__.py b/...-bench/src/raft-ann-bench/run/__main__.py → ...-bench/src/raft_ann_bench/run/__main__.py
diff --git a/...n-bench/src/raft-ann-bench/run/algos.yaml → ...n-bench/src/raft_ann_bench/run/algos.yaml b/...n-bench/src/raft-ann-bench/run/algos.yaml → ...n-bench/src/raft_ann_bench/run/algos.yaml
diff --git a/...-bench/run/conf/algos/faiss_cpu_flat.yaml → ..._bench/run/conf/algos/faiss_cpu_flat.yaml b/...-bench/run/conf/algos/faiss_cpu_flat.yaml → ..._bench/run/conf/algos/faiss_cpu_flat.yaml
diff --git a/...-bench/run/conf/algos/faiss_gpu_flat.yaml → ..._bench/run/conf/algos/faiss_gpu_flat.yaml b/...-bench/run/conf/algos/faiss_gpu_flat.yaml → ..._bench/run/conf/algos/faiss_gpu_flat.yaml
diff --git a/...ch/run/conf/algos/faiss_gpu_ivf_flat.yaml → ...ch/run/conf/algos/faiss_gpu_ivf_flat.yaml b/...ch/run/conf/algos/faiss_gpu_ivf_flat.yaml → ...ch/run/conf/algos/faiss_gpu_ivf_flat.yaml
diff --git a/...ench/run/conf/algos/faiss_gpu_ivf_pq.yaml → ...ench/run/conf/algos/faiss_gpu_ivf_pq.yaml b/...ench/run/conf/algos/faiss_gpu_ivf_pq.yaml → ...ench/run/conf/algos/faiss_gpu_ivf_pq.yaml
diff --git a/...aft-ann-bench/run/conf/algos/hnswlib.yaml → ...aft_ann_bench/run/conf/algos/hnswlib.yaml b/...aft-ann-bench/run/conf/algos/hnswlib.yaml → ...aft_ann_bench/run/conf/algos/hnswlib.yaml
diff --git a/...ench/run/conf/algos/raft_brute_force.yaml → ...ench/run/conf/algos/raft_brute_force.yaml b/...ench/run/conf/algos/raft_brute_force.yaml → ...ench/run/conf/algos/raft_brute_force.yaml
diff --git a/...-ann-bench/run/conf/algos/raft_cagra.yaml → ..._ann_bench/run/conf/algos/raft_cagra.yaml b/...-ann-bench/run/conf/algos/raft_cagra.yaml → ..._ann_bench/run/conf/algos/raft_cagra.yaml
diff --git a/...ch/run/conf/algos/raft_cagra_hnswlib.yaml → ...ch/run/conf/algos/raft_cagra_hnswlib.yaml b/...ch/run/conf/algos/raft_cagra_hnswlib.yaml → ...ch/run/conf/algos/raft_cagra_hnswlib.yaml
diff --git a/...n-bench/run/conf/algos/raft_ivf_flat.yaml → ...n_bench/run/conf/algos/raft_ivf_flat.yaml b/...n-bench/run/conf/algos/raft_ivf_flat.yaml → ...n_bench/run/conf/algos/raft_ivf_flat.yaml
diff --git a/...ann-bench/run/conf/algos/raft_ivf_pq.yaml → ...ann_bench/run/conf/algos/raft_ivf_pq.yaml b/...ann-bench/run/conf/algos/raft_ivf_pq.yaml → ...ann_bench/run/conf/algos/raft_ivf_pq.yaml
diff --git a/.../raft-ann-bench/run/conf/bigann-100M.json → .../raft_ann_bench/run/conf/bigann-100M.json b/.../raft-ann-bench/run/conf/bigann-100M.json → .../raft_ann_bench/run/conf/bigann-100M.json
diff --git a/...src/raft-ann-bench/run/conf/datasets.yaml → ...src/raft_ann_bench/run/conf/datasets.yaml b/...src/raft-ann-bench/run/conf/datasets.yaml → ...src/raft_ann_bench/run/conf/datasets.yaml
diff --git a/...rc/raft-ann-bench/run/conf/deep-100M.json → ...rc/raft_ann_bench/run/conf/deep-100M.json b/...rc/raft-ann-bench/run/conf/deep-100M.json → ...rc/raft_ann_bench/run/conf/deep-100M.json
diff --git a/.../src/raft-ann-bench/run/conf/deep-1B.json → .../src/raft_ann_bench/run/conf/deep-1B.json b/.../src/raft-ann-bench/run/conf/deep-1B.json → .../src/raft_ann_bench/run/conf/deep-1B.json
diff --git a/...n-bench/run/conf/deep-image-96-inner.json → ...n_bench/run/conf/deep-image-96-inner.json b/...n-bench/run/conf/deep-image-96-inner.json → ...n_bench/run/conf/deep-image-96-inner.json
diff --git a/...run/conf/fashion-mnist-784-euclidean.json → ...run/conf/fashion-mnist-784-euclidean.json b/...run/conf/fashion-mnist-784-euclidean.json → ...run/conf/fashion-mnist-784-euclidean.json
diff --git a/...nn-bench/run/conf/gist-960-euclidean.json → ...nn_bench/run/conf/gist-960-euclidean.json b/...nn-bench/run/conf/gist-960-euclidean.json → ...nn_bench/run/conf/gist-960-euclidean.json
diff --git a/...ann-bench/run/conf/glove-100-angular.json → ...ann_bench/run/conf/glove-100-angular.json b/...ann-bench/run/conf/glove-100-angular.json → ...ann_bench/run/conf/glove-100-angular.json
diff --git a/...t-ann-bench/run/conf/glove-100-inner.json → ...t_ann_bench/run/conf/glove-100-inner.json b/...t-ann-bench/run/conf/glove-100-inner.json → ...t_ann_bench/run/conf/glove-100-inner.json
diff --git a/...-ann-bench/run/conf/glove-50-angular.json → ..._ann_bench/run/conf/glove-50-angular.json b/...-ann-bench/run/conf/glove-50-angular.json → ..._ann_bench/run/conf/glove-50-angular.json
diff --git a/...ft-ann-bench/run/conf/glove-50-inner.json → ...ft_ann_bench/run/conf/glove-50-inner.json b/...ft-ann-bench/run/conf/glove-50-inner.json → ...ft_ann_bench/run/conf/glove-50-inner.json
diff --git a/...ann-bench/run/conf/lastfm-65-angular.json → ...ann_bench/run/conf/lastfm-65-angular.json b/...ann-bench/run/conf/lastfm-65-angular.json → ...ann_bench/run/conf/lastfm-65-angular.json
diff --git a/...n-bench/run/conf/mnist-784-euclidean.json → ...n_bench/run/conf/mnist-784-euclidean.json b/...n-bench/run/conf/mnist-784-euclidean.json → ...n_bench/run/conf/mnist-784-euclidean.json
diff --git a/...n-bench/run/conf/nytimes-256-angular.json → ...n_bench/run/conf/nytimes-256-angular.json b/...n-bench/run/conf/nytimes-256-angular.json → ...n_bench/run/conf/nytimes-256-angular.json
diff --git a/...ann-bench/run/conf/nytimes-256-inner.json → ...ann_bench/run/conf/nytimes-256-inner.json b/...ann-bench/run/conf/nytimes-256-inner.json → ...ann_bench/run/conf/nytimes-256-inner.json
diff --git a/...nn-bench/run/conf/sift-128-euclidean.json → ...nn_bench/run/conf/sift-128-euclidean.json b/...nn-bench/run/conf/sift-128-euclidean.json → ...nn_bench/run/conf/sift-128-euclidean.json
diff --git a/...raft-ann-bench/run/conf/wiki_all_10M.json → ...raft_ann_bench/run/conf/wiki_all_10M.json b/...raft-ann-bench/run/conf/wiki_all_10M.json → ...raft_ann_bench/run/conf/wiki_all_10M.json
diff --git a/.../raft-ann-bench/run/conf/wiki_all_1M.json → .../raft_ann_bench/run/conf/wiki_all_1M.json b/.../raft-ann-bench/run/conf/wiki_all_1M.json → .../raft_ann_bench/run/conf/wiki_all_1M.json
diff --git a/...raft-ann-bench/run/conf/wiki_all_88M.json → ...raft_ann_bench/run/conf/wiki_all_88M.json b/...raft-ann-bench/run/conf/wiki_all_88M.json → ...raft_ann_bench/run/conf/wiki_all_88M.json
diff --git a/...t-ann-bench/split_groundtruth/__main__.py → ...t_ann_bench/split_groundtruth/__main__.py b/...t-ann-bench/split_groundtruth/__main__.py → ...t_ann_bench/split_groundtruth/__main__.py
diff --git a/...ch/split_groundtruth/split_groundtruth.pl → ...ch/split_groundtruth/split_groundtruth.pl b/...ch/split_groundtruth/split_groundtruth.pl → ...ch/split_groundtruth/split_groundtruth.pl