Formatting

rlancemartin · rlancemartin · commit ce660fe88158 · 2023-06-15T11:39:55.000-07:00
diff --git a/langchain/document_loaders/__init__.py b/langchain/document_loaders/__init__.py
@@ -1,5 +1,6 @@
 """All different types of document loaders."""
 
+from langchain.document_loaders.acreom import AcreomLoader
 from langchain.document_loaders.airbyte_json import AirbyteJSONLoader
 from langchain.document_loaders.apify_dataset import ApifyDatasetLoader
 from langchain.document_loaders.arxiv import ArxivLoader
@@ -123,7 +124,6 @@
     GoogleApiYoutubeLoader,
     YoutubeLoader,
 )
-from langchain.document_loaders.acreom import AcreomLoader
 
 # Legacy: only for backwards compat. Use PyPDFLoader instead
 PagedPDFSplitter = PyPDFLoader
diff --git a/langchain/document_loaders/acreom.py b/langchain/document_loaders/acreom.py
@@ -1,8 +1,8 @@
 """Loader that loads acreom vault from a directory."""
-from typing import Iterator
 import re
 from pathlib import Path
-from typing import List
+from typing import Iterator, List
+
 from langchain.docstore.document import Document
 from langchain.document_loaders.base import BaseLoader
 
@@ -11,7 +11,7 @@ class AcreomLoader(BaseLoader):
     FRONT_MATTER_REGEX = re.compile(r"^---\n(.*?)\n---\n", re.MULTILINE | re.DOTALL)
 
     def __init__(
-            self, path: str, encoding: str = "UTF-8", collect_metadata: bool = True
+        self, path: str, encoding: str = "UTF-8", collect_metadata: bool = True
     ):
         """Initialize with path."""
         self.file_path = path
@@ -42,10 +42,11 @@ def _remove_front_matter(self, content: str) -> str:
         return self.FRONT_MATTER_REGEX.sub("", content)
 
     def _process_acreom_content(self, content: str) -> str:
-        # remove acreom specific elements from content that do not contribute to the context of current document
-        content = re.sub('\s*-\s\[\s\]\s.*|\s*\[\s\]\s.*', "", content)  # rm tasks
-        content = re.sub('#', "", content)  # rm hashtags
-        content = re.sub('\[\[.*?\]\]', "", content) # rm doclinks
+        # remove acreom specific elements from content that
+        # do not contribute to the context of current document
+        content = re.sub("\s*-\s\[\s\]\s.*|\s*\[\s\]\s.*", "", content)  # rm tasks
+        content = re.sub("#", "", content)  # rm hashtags
+        content = re.sub("\[\[.*?\]\]", "", content)  # rm doclinks
         return content
 
     def lazy_load(self) -> Iterator[Document]: