Използвайте Excel като инструмент за копиране на данни от мрежата

Уеб(Web) изстъргването е актът на извличане на данни, информация или изображения от уебсайт с помощта на автоматизиран метод. Мислете(Think) за това като копиране и поставяне на напълно автоматично.

Ние или пишем, или използваме приложение, за да отидем до уебсайтовете, на които искаме, и да направим копие на конкретните неща, които искаме от тези уебсайтове. Това е много по-точно от изтеглянето на цял уебсайт(downloading an entire website) .

Като всеки инструмент, уеб изстъргването може да се използва за добро или зло. Някои от по-добрите причини за изстъргване на уебсайтове биха били класирането им в търсачка въз основа на съдържанието му, пазаруване за сравнение на цените или наблюдение на информацията за фондовия пазар. Може дори да го използвате като своеобразен изследователски инструмент.

Как мога да изстъргвам уебсайтове с Excel ?

Вярвате или не, Excel има способността да извлича данни от уебсайтове за дълго време, поне от Excel 2003 . Просто изстъргването в мрежата е нещо, за което повечето хора не се сещат, да не говорим за използването на програма за електронни таблици, за да свърши работата. Но е изненадващо лесно и мощно. Нека научим как се прави, като направим колекция от клавишни комбинации на Microsoft Office .

Намерете сайтовете, които искате да изстържете

Първото нещо, което ще направим, е да намерим конкретните уеб страници, от които искаме да получим информация. Да отидем до източника и да потърсим на https://support.office.com/ . Ще използваме термина за търсене „често използвани преки пътища“. Можем да го направим по-конкретно, като използваме името на конкретното приложение, като Outlook , Excel , Word и т.н. Може да е добра идея да маркирате страницата с резултати, за да можем лесно да се върнем там.

Щракнете(Click) върху резултата от търсенето „Клавишни комбинации в Excel за Windows“. Веднъж на тази страница, намерете списъка с версии на Excel и щракнете върху По-нови версии(Newer Versions) . Сега работим с най-новото и най-доброто.

Можем да се върнем към страницата ни с резултати от търсенето и да отворим резултатите за всички други приложения на Office в техните собствени раздели и да ги направим отметка. Това е добра идея, дори и за това упражнение. Това е мястото, където повечето хора биха спрели да събират преки пътища на Office , но не и ние. Ще ги поставим в Excel , за да можем да правим каквото си поискаме с тях, когато пожелаем.

Отворете Excel и Scrape

Отворете Excel и стартирайте нова работна книга. Запазете работната книга като преки пътища за Office(Office Shortcuts) . Ако имате OneDrive, запазете го там, за да работи функцията AutoSave .

След като работната книга бъде запазена, щракнете върху раздела Данни(Data) .

В лентата на раздела Данни(Data) щракнете върху От мрежата(From Web) .

Ще се отвори прозорецът От уеб съветника. (From Web )Тук поставяме уеб адреса или URL адреса(URL) на уебсайта, от който искаме да изтрием данни. Превключете към вашия уеб браузър и копирайте(copy) URL адреса.

Поставете URL адреса в полето за URL адрес(URL) на съветника От уеб . (From Web)Можем да изберем да използваме това в Основен(Basic) или Разширен(Advanced) режим. Разширеният режим ни дава много повече възможности за достъп до данните от уебсайта . (Advanced)За това упражнение се нуждаем само от Основен режим. Щракнете върху (Click) OK .

Сега Excel(Excel) ще се опита да се свърже с уебсайта. Това може да отнеме няколко секунди. Ще видим прозорец за напредък, ако е така.

Ще се отвори прозорецът на навигатора(Navigator) и ще видим списък с таблици от уебсайта вляво. Когато изберем един, ще видим преглед на таблица вдясно. Нека изберем таблицата с често използвани преки пътища .(Frequently used shortcuts )

Можем да щракнем върху раздела Web View , за да видим действителния уебсайт, ако трябва да се огледаме за таблицата, която искаме. Когато го намерим, можем да щракнем върху него и той ще бъде избран за импортиране.

Сега щракваме върху бутона Зареждане(Load) в долната част на този прозорец. Има и други опции, които можем да изберем, които са по-сложни и извън обхвата на първото ни остъргване. Просто имайте предвид, че те са там. Възможностите за уеб изстъргване на Excel са много мощни.

Уеб таблицата ще бъде заредена в Excel след няколко секунди. Ще видим данните вляво, където числото 1 е на снимката по-долу. Номер 2 подчертава заявката(Query) , използвана за получаване на данните от уебсайта. Когато имаме множество заявки в работна книга, тук избираме тази, която трябва да използваме.

Забележете(Notice) , че данните идват в електронната таблица като таблица в Excel . Вече е настроен, за да можем да филтрираме или сортираме данните.

Можем да повторим този процес за всички други уеб страници, които имат преките пътища на Office , които искаме за Outlook , Word , Access , PowerPoint и всяко друго приложение на Office .

Поддържане на изпипаните данни актуални(Scraped Data Current) в Excel

Като бонус за вас ще научим как да поддържаме изписаните си данни свежи в Excel . Това е чудесен начин да се илюстрира колко мощен е Excel за изстъргване на данни. Дори и с това, ние правим само най-основното изстъргване, което Excel може да направи.

За този пример нека използваме уеб страница с информация за акции като https://www.cnbc.com/stocks/ .

Прегледайте това, което направихме преди и копирайте и поставете новия URL адрес(URL) от адресната лента.

Ще стигнете до прозореца на навигатора(Navigator) и ще видите наличните таблици. Нека изберем основните фондови индекси на САЩ(Major U.S. Stock Indices) .

След като данните бъдат изписани, ще видим следната електронна таблица.

Вдясно виждаме заявката за основни американски фондови индекси(Major U.S. Stock Indexes) . Изберете(Select) това, така че да бъде подчертано. Уверете(Make) се, че сме в раздела Инструменти за таблица(Table Tools) и в областта за проектиране(Design) . След това щракнете върху стрелката надолу под Refresh . След това щракнете върху Свойства на връзката(Connection Properties) .

В прозореца Свойства на заявката(Query Properties ) , под раздела Използване(Usage) , можем да контролираме как тази информация се опреснява. Можем да зададем конкретен период от време за опресняване или за опресняване, когато отворим работната книга следващия път, или за опресняване на заден план, или всяка комбинация от тях. След като изберем какво ни трябва, щракнете върху OK , за да затворите прозореца и да продължите.

Това е! Сега можете да проследявате цените на акциите, спортните резултати или всякакви други данни, които се променят често от електронна таблица на Excel . Ако сте добри с уравненията и функциите на Excel(Excel equations and functions) , можете да правите почти всичко, което искате с данните.

Може би се опитайте да идентифицирате тенденциите на акциите, управлявайте фантастичен спортен басейн на работа или може би просто следете времето. Кой знае? Вашето въображение и наличните данни в Интернет(Internet) са единствените ограничения.



About the author

Аз съм компютърен инженер с над 10 години опит в софтуерната индустрия, по-специално в Microsoft Office. Написал съм статии и уроци по различни теми, свързани с Office, включително съвети как да използвам функциите му по-ефективно, трикове за овладяване на обичайните офис задачи и др. Моите умения като писател също ме правят отличен ресурс за други, които искат да научат за Office или просто се нуждаят от бърз съвет.



Related posts