https://blog.groupdocs.com/parser/extract-text-and-metadata-from-documents-using-java/