Trhl jsem rekord ve velikosti tabulky :)

404m.com, 18. srpna 2015 ve 00:18:14, 9x přečteno

Jak jste si mohli p?e?íst v jednom z p?edchozích ?lánk?, tak jsem se po delší dob? pustil zase do programování. V podstat? zkouším dávat dohromady takový velkou databázi r?zných keyword? a data k nim. Dneska koukám, že W01 (worker 01) za 3 dny nashromáždil 946.247 URL k 9299 nejhledan?jším klí?ovým slov?m. Tím jsem také trhl osobní rekord v po?tu záznam? v jedné MySQL tabulce.

V?era jsem ty data zkusil zpracovat a vytvo?it první relase (z cca 660K záznam?). Kdo sleduje m?j profil na FB, tak si mohl zkusit dohledat jak si vede jeho doména, anebo kouknout na jaké keywordy cílí jeho konkurence.Vzhledem k tomu, že W01 bere data z prvotního nást?elu databáze keyword?, tak jsou tam jen hodn? hledaná klí?ová slova. Po?ítám, že použitelná verze bude minimáln? 5x v?tší.

Tady jsem narazil také na první zádrhel, který je momentáln? nad moje programátorské schopnosti. Tabulka relase má 627K záznam? o celkové velikosti 166 MB (Index 98,4 MB). Zpracování dotazu (LIKE %domena% z VARCHAR (url) s indexem) trvá 2 – 3 vte?iny. Jist? dalo by se to vy?ešit p?esunutím domény do samostatného sloupce, ale to by pak p?išel uživatel o možnost filtrovat ?ásti URL. Navíc v relase je zatím jen Seznam. Budu do ní p?idávat ješt? pozice na Google, hledanost Google, ranky a po?et zp?tných odkaz?. Takže musím nastudovat jak to zrychlit, pokud to má být ve?ejn? p?ístupné.

Pokračování na: 404m.com

Související články

Kontrola ze živnostenského ú?adu

Dneska bych se s vámi rád pod?lil o zkušenost z kontroly ze živnostenského ú?adu. Jak jsem se na ní p?ipravil, jak prob?hla i jaké dojmy ve m?…

Jak jsem se p?estal bát obsah p?episovat pro dobro ?tená??

Už je to snad 10 let, co jsem za?al d?lat obsahové weby kv?li „p?ilepšení si“. Od za?átku bylo to nejt?žší a nejvzácn?jší obsah. Pokud…

Ultimátní test webhosting? – duben 2020

P?íští m?síc to bude rok, co jsem se pustil do testování dostupných webhostingových služeb od nejv?tších poskytovatel?. Už mi pomalu…


Komentáře

(nezobrazuje se)