it-swarm.dev

Textový editor pro otevření velkých (obrovských, velkých, velkých) textových souborů

Mám na mysli 100+ MB velkých; takové textové soubory mohou stisknout obálku editorů.

Musím se podívat přes velký XML soubor, ale nemůžu, pokud je editor buggy.

Nějaké návrhy?

1023
Yuvi

VS kód(Windows, macOS, Linux) - Free a Open Source s Nice GUI. Upravený soubor 3,6 GB JSON, načtený za minutu. Musíte mít dostatek RAM pro načtení souborů.

Diváci, kteří mají jen ke čtení:

  • glogg (Windows, macOS, Linux) - Potvrzeno, že bude pracovat s více GB soubory. Jeho hlavní funkcí je vyhledávání regulárních výrazů. Má karty, čte soubory přímo z disku, může sledovat/sledovat soubory a umožňuje uživateli označit řádky.
  • LogExpert (Windows) - "Náhrada GUI tail." Podporuje sledování souborů, vyhledávání, filtrování, konfigurovatelné zvýraznění, pluginy a externí nástroje.
  • Prohlížeč velkých textových souborů (Windows) - Minimalistický a má velmi malou velikost spustitelného souboru. Podporuje rozdělené zobrazení, přizpůsobení motivu textu, vyhledávání v regexu a následující soubor.
  • Lister (Windows) - Ještě menší a minimalistický. Je to jeden spustitelný soubor, sotva 500 KB, ale stále podporuje vyhledávání (s regexes), tisk, hexadecimální režim a nastavení.

Bezplatné editory:

  • Vim a Emacs (Windows, macOS, Linux) - Klasické editory Unixu. Strmá křivka učení, ale brutálně efektivní. Mají nastavení, která lze naladit tak, aby byly ještě rychlejší.
  • Editor velkých souborů (Windows) - Otevře a upraví soubory TB +, podporuje Unicode, používá malou paměť, má specifické funkce XML a obsahuje binární režim.
  • HxD (Windows) - hexadecimální editor, ne textový editor; ale je to úžasně rychlé a užitečné.
  • GigaEdit (Windows) - Podporuje vyhledávání, statistiku znaků a přizpůsobení fontů. Ale je to buggy - s velkými soubory, to umožňuje pouze přepsání znaků, ne vkládání; nerešpektuje LF jako terminátor linky, pouze CRLF; a je to pomalé.

Vestavěné programy (bez instalace):

  • méně (macOS, Linux) - Tradiční nástroj příkazového řádku Unixu. Umožňuje zobrazit textové soubory prakticky libovolné velikosti. Lze nainstalovat i ve Windows.
  • Poznámkový blok (Windows) - Decentní s velkými soubory, zejména s Word wrap vypnut.
  • VÍCE (Windows) - Jedná se o Windows MORE, nikoli Unix more. Konzolový program, který umožňuje zobrazit soubor po jedné obrazovce.

Weboví diváci:

  • htmlpen.com - Může otevřít a syntaxe zvýraznit soubory TB +. Umožňuje úpravy, s výjimkou velmi velkých souborů. Podporuje vyhledávání, regexes a export.
  • readfileonline.com - Další prohlížeč velkých souborů HTML5. Podporuje vyhledávání.

Placené editory:

  • 010 Editor (Windows, macOS, Linux) - Otevře obří (až 50 GB) soubory.
  • SlickEdit (Windows, macOS, Linux) - Otevře velké soubory.
  • UltraEdit (Windows, macOS, Linux) - Otevře soubory větší než 6 GB, ale konfigurace musí být změněna, aby to bylo praktické: Menu »Pokročilé» Konfigurace »Zpracování souborů» Dočasné soubory »Otevřít soubor bez dočasného souboru ...
  • EmEditor (Windows) - zpracovává velmi velké textové soubory pěkně (oficiálně až 248 GB, ale až 900 GB podle jedné sestavy).

A konečně jste se pokusili otevřít velký soubor s pravidelným editorem? Někteří redaktoři mohou skutečně zpracovávat poměrně velké soubory. Zejména Notepad ++ (Windows) a Sublime Text (Windows, macOS, Linux) podporuje soubory v rozsahu 2 GB.

1256
Nick Ryberg

Tipy a triky

méně

Proč používáte editory na právě podívejte se ve velkém souboru?

Pod * nix nebo Cygwin , stačí použít méně . (Tam je slavný přísloví - “méně je více, více nebo méně” - protože “méně” nahradil starší Unix příkaz “více”, s tím, že vy byste mohli posouvat se nahoru.) Vyhledávání a navigace pod méně je velmi podobný\t Vim, ale neexistuje žádný swapový soubor a malý RAM použitý.

Je zde port Win32 GNU menší. Viz výše uvedená část „méně“.

Perl

Perl je dobrý pro rychlé skripty a jeho operátor .. (range flip-flop) je pro mechanismus výběru Nice, který omezuje hru crud, kterou musíte projít.

Například:

$ Perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

To bude extrahovat vše z řádku 1 milionu na řádek 2 miliony, a umožní vám sift výstup manuálně v méně.

Další příklad:

$ Perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

To začíná tisknout, když "regulární výraz jeden" najde něco, a zastaví, když "regulární výraz dva" najít konec zajímavého bloku. Může najít více bloků. Sift výstup ...

logparser

To je další užitečný nástroj, který můžete použít. Citovat článek Wikipedie :

logparser je flexibilní nástroj příkazového řádku, který původně napsal Gabriele Giuseppini, zaměstnanec společnosti Microsoft, k automatizaci testů pro protokolování IIS. To bylo určeno pro použití s ​​operačním systémem Windows, a byl součástí s IIS 6.0 Resource Kit Tools. Výchozí chování logparseru funguje jako "pipeline pro zpracování dat" tím, že na příkazovém řádku zadá výraz SQL a vydá řádky obsahující shody pro výraz SQL.

Společnost Microsoft popisuje Logparser jako výkonný, univerzální nástroj, který poskytuje univerzální přístup k dotazům na textová data, jako jsou soubory protokolu, soubory XML a soubory CSV, jakož i klíčové zdroje dat v operačním systému Windows, jako je například Protokol událostí, registr, systému souborů a Active Directory. Výsledky vstupního dotazu mohou být naformátovány v textovém výstupu, nebo mohou být zachovány na více specializovaných cílů, jako je SQL, SYSLOG nebo graf.

Příklad použití:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

Relativnost velikostí

100 MB není příliš velká. 3 GB je dost velký. Pracoval jsem v tiskovém a poštovním zařízení, které vytvořilo asi 2% prvotřídní pošty v USA. Jeden ze systémů, pro které jsem byl technickým vedením, představoval asi 15 +% kusů pošty. Měli jsme tu nějaké velké soubory, které jsme tu a tam ladili.

A více...

Můžete zde přidat další nástroje a informace. Tato odpověď je z nějakého důvodu komunitní wiki! Všichni potřebujeme více rad o řešení velkého množství dat ...

178
Roboprog