Как да отваряте наистина големи текстови и CSV файлове

MS Excel може да показва 1 048 576 реда. Въпреки че това може да изглежда като наистина голям брой при нормална употреба, има много сценарии, при които това не е достатъчно.

Независимо дали разглеждате регистрационни файлове или големи набори от данни, лесно е да попаднете на CSV файлове с милиони редове или огромни текстови файлове. Тъй като Excel не може да поддържа толкова големи файлове, как точно да ги отворите? Нека разберем.

Защо нормалните текстови редактори(Normal Text Editors) не могат да отварят наистина големи файлове(Open Really Large Files) ?

Компютърът има гигабайти памет, така че защо текстовите редактори не могат да отварят големи файлове?

Тук действат два фактора. Някои приложения имат твърдо зададено ограничение за това колко данни могат да показват. Няма значение колко памет има вашият компютър, те просто няма да го използват.

Вторият проблем е RAM . Много текстови редактори нямат твърдо ограничение за броя на редовете, но не могат да показват големи файлове поради ограничения на паметта. Те зареждат целия файл в системната RAM памет(RAM) , така че ако тази памет не е достатъчно голяма, процесът се проваля.

Метод №1: Използване на безплатни редактори

Най-добрият начин да видите изключително големи текстови файлове е да използвате... текстов редактор. Не просто всеки текстов редактор, а инструментите, предназначени за писане на код. Такива приложения обикновено могат да обработват големи файлове без затруднения и са безплатни.

Large Text File Viewer е може би най-простото от тези приложения. Той е наистина лесен за използване, работи бързо и има много нисък отпечатък на ресурсите. Единственият недостатък? Не може да редактира файловете. Но ако искате да преглеждате само големи CSV файлове, това е най-добрият инструмент за тази работа.

За да редактирате и големи текстови файлове, трябва да опитате Emacs . Първоначално създаден за Unix системи, той работи перфектно и на Windows и може да обработва големи файлове. По същия начин, Neovim и Sublime Text са две леки IDE , които могат да се използват за отваряне на (IDEs)CSV текстови файлове с размер на гигабайта .

Ако всичко, което търсите, е да търсите данни чрез големи регистрационни файлове, тогава klogg е точно инструментът за вас. Актуализираща вилка на популярния glogg , това приложение ви позволява да извършвате сложни операции за търсене чрез огромни текстови файлове с лекота. Тъй като компютърно генерираните регистрационни файлове често могат да имат милиони редове, klogg е проектиран да работи с такива размери на файлове без проблем.

Метод(Method) №2: Разделете на множество части(Into Multiple Parts)

Целият проблем с опитите за отваряне на големи CSV файлове е, че те са твърде големи. Но какво ще стане, ако ги разделите на множество по-малки файлове?

Това е популярно решение, тъй като обикновено не включва необходимостта от изучаване на интерфейса на нов текстов редактор. Вместо това можете да използвате един от многото CSV сплитери, налични онлайн,(one of the many CSV splitters available online) за да разделите големия файл на редица лесни за отваряне файлове. След това всеки от тези файлове може да бъде достъпен нормално.

Това обаче не е най-добрият начин да направите това. Разделянето на голям файл често може да доведе до странни печатни грешки или неправилно конфигурирани файлове. Освен това отварянето на всяка част поотделно ви предотвратява филтрирането на всички данни наведнъж.

Метод №3: Импортиране в база данни

Текстовите и .csv файловете, простиращи се до няколко гигабайта, обикновено са големи набори от данни. Така че защо просто не ги импортирате в база данни?

SQL е най-разпространеният език за маркиране на база данни, използван в наши дни. Има много използвани версии на SQL(many versions of SQL) , но най-лесната е може би MySQL . И за късмет е възможно да конвертирате CSV файл в MySQL таблица(convert a CSV file into a MySQL table) .

Това в никакъв случай не е най-лесният метод за работа с големи CSV файлове, така че препоръчваме това само ако искате да работите редовно с големи набори от данни. Ако MySQL звучи твърде трудно, винаги можете вместо това да импортирате вашите .csv файлове в MS Access .

Метод(Method) №4: Анализирайте с библиотеки на Python(Python)

Когато работите с .csv файл с милиони редове данни, очевидно няма да можете да го разберете ръчно. Вероятно искате да филтрирате данните и да изпълнявате конкретни заявки, за да разберете тенденциите.

Така че защо не напишете код на Python,(write Python code) за да направите точно това?

Още веднъж, това не е най-удобният метод. Въпреки че Python не е най-трудният език за програмиране за научаване(Python isn’t the hardest programming language to learn) , той е кодиране, така че може да не е най-добрият подход за вас. Все пак, ако се налага да анализирате наистина големи CSV файлове всеки ден, може да искате да автоматизирате задачата с някакъв код на Python(automate the task with some Python code) .

Метод № 5: С първокласни инструменти

Текстовите редактори, които видяхме в първия метод, не бяха специални инструменти, предназначени за CSV обработка. Те бяха инструменти с общо предназначение, които можеха да се използват и за работа с големи .csv файлове.

Но какво да кажем за специализираните приложения? Няма ли приложения, създадени за решаване на този проблем?

Всъщност има ги. CSV Explorer , например, се основава на самия процес, който описахме в последните два метода ( SQL база данни и Python код), за да създаде приложение, способно да преглежда и редактира CSV файлове от всякакъв размер. Можете да правите всичко, което очаквате от инструмент за електронни таблици, като например създаване на графики или филтриране на данните в CSV Explorer .

Друга опция е UltraEdit . За разлика от предишния инструмент, това е предназначено не само за .csv файлове, но и за всякакъв тип текстов файл. Той може лесно да обработва текстови и CSV файлове, вариращи до няколко гигабайта, с интерфейс, подобен на много от безплатните редактори, които обсъждахме по-рано. 

Единственият недостатък на тези инструменти е, че те са първокласни приложения, които изискват да получите платен лиценз, за ​​да можете да ги използвате. Винаги можете да изпробвате техните безплатни пробни версии, за да проверите техните функции или ако използвате само еднократно.

Кой е най-добрият начин за отваряне на големи текстови(Large Text) и CSV файлове(CSV Files) ?

В тази епоха на големите данни(Big Data) не е необичайно да се сблъскате с текстови файлове, работещи в гигабайти, които могат да бъдат трудни за разглеждане дори с вградени инструменти като Notepad или MS Excel . За да можете да отваряте такива големи CSV файлове, трябва да изтеглите и използвате приложение на трета страна.

Ако всичко, което искате, е да преглеждате такива файлове, тогава Large Text File Viewer е най-добрият избор за вас. За да ги редактирате реално, можете да опитате богат на функции текстов редактор като Emacs или да изберете първокласен инструмент като CSV Explorer .

Техники като разделяне на CSV файла или импортирането му в база данни включват твърде много стъпки. По-добре е да получите платен лиценз за специален първокласен инструмент, ако откриете, че работите много с огромни текстови файлове.



About the author

Аз съм компютърен професионалист с над 10 години опит. В свободното си време обичам да помагам на бюрото в офиса и да уча децата как да използват интернет. Моите умения включват много неща, но най-важното е, че знам как да помагам на хората да решават проблеми. Ако имате нужда от някой, който може да ви помогне с нещо спешно или просто искате някои основни съвети, моля, свържете се с мен!



Related posts