pytorch
diff --git a/‎.circleci/config.yml
Lines changed: 5 additions & 181 deletions b/‎.circleci/config.yml
Lines changed: 5 additions & 181 deletions
diff --git a/‎.circleci/regenerate.py
Lines changed: 1 addition & 1 deletion b/‎.circleci/regenerate.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎.gitattributes
Lines changed: 2 additions & 0 deletions b/‎.gitattributes
Lines changed: 2 additions & 0 deletions
diff --git a/‎README.rst
Lines changed: 1 addition & 1 deletion b/‎README.rst
Lines changed: 1 addition & 1 deletion
diff --git a/‎setup.py
Lines changed: 1 addition & 4 deletions b/‎setup.py
Lines changed: 1 addition & 4 deletions
diff --git a/‎test/test_transforms.py
Lines changed: 22 additions & 3 deletions b/‎test/test_transforms.py
Lines changed: 22 additions & 3 deletions
@@ -20,7 +20,7 @@
 import os.path
 
 
-PYTHON_VERSIONS = ["3.6", "3.7", "3.8", "3.9"]
+PYTHON_VERSIONS = ["3.7", "3.8", "3.9"]
 
 DOC_VERSION = ('linux', '3.8')
 
 
@@ -0,0 +1,2 @@
+# To exclude autogenerated files from code reviews
+.circleci/config.yml linguist-generated=true
@@ -29,7 +29,7 @@ We recommend Anaconda as a Python package management system. Please refer to `py
    :header: "PyTorch version", "torchtext version", "Supported Python version"
    :widths: 10, 10, 10
 
-   nightly build, main, ">=3.6, <=3.9"
+   nightly build, main, ">=3.7, <=3.9"
    1.10.0, 0.11.0, ">=3.6, <=3.9" 
    1.9.1, 0.10.1, ">=3.6, <=3.9" 
    1.9, 0.10, ">=3.6, <=3.9"
 
@@ -92,12 +92,9 @@ def run(self):
     ],
     python_requires='>=3.5',
     classifiers=[
-        'Programming Language :: Python :: 3',
-        'Programming Language :: Python :: 3.5',
-        'Programming Language :: Python :: 3.6',
         'Programming Language :: Python :: 3.7',
         'Programming Language :: Python :: 3.8',
-        'Programming Language :: Python :: 3 :: Only',
+        'Programming Language :: Python :: 3.9',
     ],
     # Package info
     packages=find_packages(exclude=('test*', 'build_tools*')),
 
@@ -1,3 +1,4 @@
+import os
 import torch
 from torchtext import transforms
 from torchtext.vocab import vocab
@@ -205,7 +206,7 @@ def test_add_token_jit(self):
 
 
 class TestGPT2BPETokenizer(TorchtextTestCase):
-    def _gpt2_bpe_tokenizer(self, test_scripting):
+    def _load_tokenizer(self, test_scripting):
         encoder_json = "gpt2_bpe_encoder.json"
         bpe_vocab = "gpt2_bpe_vocab.bpe"
         tokenizer = transforms.GPT2BPETokenizer(
@@ -214,7 +215,9 @@ def _gpt2_bpe_tokenizer(self, test_scripting):
         )
         if test_scripting:
             tokenizer = torch.jit.script(tokenizer)
+        return tokenizer
 
+    def _gpt2_bpe_tokenizer(self, tokenizer):
         sample_texts = [
             "Hello World!, how are you?",
             "Hélló  WoŕlḊ¿",
@@ -240,8 +243,24 @@ def _gpt2_bpe_tokenizer(self, test_scripting):
 
     def test_gpt2_bpe_tokenizer(self):
         """test tokenization on single sentence input as well as batch on sentences"""
-        self._gpt2_bpe_tokenizer(test_scripting=False)
+        self._gpt2_bpe_tokenizer(self._load_tokenizer(test_scripting=False))
 
     def test_gpt2_bpe_tokenizer_jit(self):
         """test tokenization with scripting on single sentence input as well as batch on sentences"""
-        self._gpt2_bpe_tokenizer(test_scripting=True)
+        self._gpt2_bpe_tokenizer(self._load_tokenizer(test_scripting=True))
+
+    def test_gpt2_bpe_tokenizer_save_load_pybind(self):
+        tokenizer = self._load_tokenizer(test_scripting=False)
+        tokenizer_path = os.path.join(self.test_dir, 'gpt2_tokenizer_pybind.pt')
+        torch.save(tokenizer, tokenizer_path)
+        loaded_tokenizer = torch.load(tokenizer_path)
+        self._gpt2_bpe_tokenizer((loaded_tokenizer))
+
+    def test_gpt2_bpe_tokenizer_save_load_torchscript(self):
+        tokenizer = self._load_tokenizer(test_scripting=False)
+        tokenizer_path = os.path.join(self.test_dir, 'gpt2_tokenizer_torchscript.pt')
+        # Call the __prepare_scriptable__() func and convert the building block to the torbhind version
+        # Not expect users to use the torchbind version on eager mode but still need a CI test here.
+        torch.save(tokenizer.__prepare_scriptable__(), tokenizer_path)
+        loaded_tokenizer = torch.load(tokenizer_path)
+        self._gpt2_bpe_tokenizer((loaded_tokenizer))
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,2 @@`
	`1`	`+# To exclude autogenerated files from code reviews`
	`2`	`+.circleci/config.yml linguist-generated=true`