-
Notifications
You must be signed in to change notification settings - Fork 51
Closed
Description
При считывании этого документа неправильно определяются размер шрифта:
import numpy as np
from dedoc.readers import DocxReader
filepath = "Приложение 2.docx"
reader = DocxReader(config={})
document = reader.read(filepath, parameters={"with_attachments": "false"})
for index, line in enumerate(document.lines):
annotation = line.annotations
wheres = (np.where(np.asarray([x.name for x in annotation]) == "size"))[0]
print(line.line)
for where in wheres:
print(annotation[where])
Вывод следующий:
Приложение 2
к распоряжению
Size(0:29, 12.0)
Соотношение долей командных и индивидуальных ключевых показателей эффективности для целей проведения оценки результативности работников
Size(0:137, 12.0)
Size(44:45, 11.0)
В последней строке присутствуют 2 разных шрифта, при этом пересекающихся между собой
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels