Pokud máte tabulková data ve formátu dokumentů PDF nebo Word, určitě je musíte převést do tabulek Excelu. Tento scénář se stává složitým, pokud existuje mnoho tabulek nebo více sešitů. Určitě musíte tento postup zautomatizovat. V tomto článku uvidíme, jak převést PDF do Excelu a také jak převést dokumenty Wordu do Excelových tabulek programově v C# pomocí .NET API.
Následují témata stručně probíraná v tomto článku:
- .NET API – Převod dokumentů na tabulky
- Převést PDF do Excelu
- Převést Word do Excelu
- Převod PDF nebo Word do tabulky s více možnostmi
.NET API – Převod do tabulkových formátů
V tomto článku budu používat GroupDocs.Conversion for .NET k převodu dokumentů PDF a Wordu na tabulky pomocí C#. Jedná se o funkčně bohaté API, které umožňuje převod dokumentů a obrázků v mnoha formátech souborů. Pro zvýraznění některých formátů rozhraní API podporuje textové dokumenty, tabulky, prezentace, výkresy AutoCADu, elektronické knihy, PDF, e-mailové soubory, webové stránky, obrázky, soubory photoshop a mnoho dalších formátů dokumentů.
Stáhněte si DLL nebo instalační program MSI z části ke stažení nebo nainstalujte API do své aplikace .NET prostřednictvím NuGet.
PM> Install-Package GroupDocs.Conversion
Převod PDF do Excelu v C#
Následuje postup převodu dokumentu PDF na tabulku aplikace Excel.
- Načtěte soubor PDF pomocí třídy Converter.
- Inicializujte možnost převodu pomocí třídy SpreadsheetConvertOptions.
- Volejte metodu Convert třídy Converter s možností.
Následující ukázka kódu ukazuje, jak převést soubor PDF do formátu Excel XLSX pomocí C#.
// Převést dokument PDF do tabulky Excel v C#
using (Converter converter = new Converter("document.pdf"))
{
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}
Převést Word do Excelu v C#
Jakýkoli dokument aplikace Word můžete převést na tabulku aplikace Excel stejným způsobem, jakým jsme převedli soubor PDF výše. Musíme pouze poskytnout správný zdrojový soubor pro převod do XLS nebo XLSX.
Následuje postup převodu dokumentu aplikace Word ve formátu DOC DOCX na tabulku aplikace Excel.
- Načtěte soubor aplikace Word pomocí třídy Converter.
- Inicializujte možnost převodu pomocí třídy SpreadsheetConvertOptions.
- Volejte metodu Convert třídy Converter s možností.
Následující ukázka kódu ukazuje, jak převést soubor DOC nebo DOCX do formátu Excel XLSX pomocí C#.
// Převést dokument Word na tabulku Excel v C#
using (Converter converter = new Converter("document.docx"))
{
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions();
converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}
Převod PDF nebo Word do tabulky s více možnostmi pomocí C#
Můžete převést pouze některé z vybraných stránek dokumentu. Rozhraní API vám dává oprávnění převádět dokument s různými možnostmi, které zahrnují:
- Číslo úvodní stránky.
- Počet stránek k převodu.
- Konkrétní stránky pro konverzi.
- Formát, do kterého se má převést.
- Heslo pro ochranu souboru.
- Přiblížením jej zvětšíte nebo zmenšíte.
- Vodoznak v souboru převodníku.
Níže jsou uvedeny kroky, jak převést některé stránky souboru PDF do formátu XLSX s různým přiblížením pomocí C#.
// Převeďte druhou stránku souboru PDF do Excelu v C# s některými možnostmi
using (Converter converter = new Converter("document.pdf"))
{
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
PageNumber = 2,
PagesCount = 1,
Format = SpreadsheetFileType.Xlsx,
Zoom = 150
};
converter.Convert("outputpath/convertedSpreadsheet.xlsx", options);
}
Zde je soubor PDF a převedená tabulka jako výstup pomocí výše uvedeného kódu. Převedl druhou stránku souboru PDF do formátu XLSX.
Získejte bezplatnou licenci API
Můžete získat bezplatnou dočasnou licenci, abyste mohli používat API bez omezení hodnocení.
Závěr
V tomto článku jste se naučili, jak převést dokumenty PDF a Word do tabulky Excel pomocí C#. Kromě toho jste také viděli, jak můžeme převést jakoukoli část dokumentu pomocí možností, jako je zoom, vodoznak a zabezpečení heslem. Nyní můžete začít budovat svou vlastní aplikaci pro konverzi dokumentů na bázi .NET nebo integrovat funkce do své stávající aplikace.
Další podrobnosti, možnosti a příklady naleznete v úložišti documentation a GitHub. Pro další dotazy kontaktujte podporu na fóru.