Ongelma Googlen indeksoinnissa

Tatu Henriksson

AA, VT
Mode
Liittynyt
2.9.2004
Viestejä
2 477
Kaupunki
Helsinki
Kukaan ei ole tähän mennessä pystynyt antamaan ratkaisua ongelmaani, joten yritetään täältä. Google (tai mikään muu hakurobotti) ei indeksoi sivujani lainkaan. Sivut ovat olleen online useita kuukausia ja sivut on myös ilmoitettu indeksoitaviksi mm. Googleen, Altavistaan ja www.fi hakukoneeseen.

Googleen on aivan mahdotonta edes yrittää ottaa yhteyttä, eikä FAQ osiolta löydy vastausta. Muutama sivuja harrastuksena tekevä henkilö on katsonut sivut läpi, eikä mitään ongelmaa pitäisi olla. Olen tässä vaiheessa jo valmis maksamaan tämän ongelman selvittämiseksi! HELP!!!

Ongelmasivujen osoite on www.advoline.fi.
 
10% ALENNUS KOODILLA PAKKOTOISTO
http://www.google.com/addurl/ Tuonne lisää urlisi, niin indeksoi luultavasti. Tee tuota aika ajoin.

En myöskään nähnyt ainuttakaan keywordia meta-tiedoissa. Vaikka google ei niitä tarvitse, niin ainakin omat kotisivuni ponkasit korkealle hakutuloksissa, kun lisäilin tärkeitä avainsanoja.

Tässä esimerkki:

meta name="Description" content="asianajaja, lakitoimisto"
meta name="Keywords" content="muuta cheisseä tähän esim"

Edit, bongasinpa erikoisen meta tiedon tuolta lähdekoodista. Viisammat voivat selventää mitä tämä tarkoittaa, mutta aika pahaenteinen sana tuo noindex:

meta name='robots' content='noindex,nofollow'

Pitääkö ottaa pois vai antaa olla, siinäpä kysymys :)
 
Eikö tuo robots meta-tieto ollut sitä varten, ettei ns. tiettyä linkkipolkua noudattavalle "sivuketjulle" pääsee/ei pääse haulla? Eli jos tuo on indeksi-sivulla, niin jää periaatteessa kaikki muutkin sivut pimentoon.
 
Eikö tuo robots meta-tieto ollut sitä varten, ettei ns. tiettyä linkkipolkua noudattavalle "sivuketjulle" pääse haulla? Eli jos tuo on indeksi-sivulla, niin jää periaatteessa kaikki muutkin sivut pimentoon.

Quote: http://www.heikniemi.net/kirj/web/robots.html
"Sivun HEAD-osaan sijoitettavalla META ROBOTS -tagilla on mahdollista ohjata hakurobottien toimintaa. Toukokuussa 1996 kokoontuneen W3C:n Indexing Workshopin muistiinpanoissa määritellään tagille neljä eri tilaa: ALL vastaa oletusarvoista tilaa, eli robotit voivat vapaasti indeksoida sivun ja sen linkit. NOINDEX estää hakukonetta indeksoimasta tätä yksittäistä sivua, mutta ei kiellä sivulla olevien linkkien seuraamista (ja mahdollisesti niiden sisällön indeksoimista). NOFOLLOW jättää itse sivun indeksoitavaksi, mutta kieltää seuraamasta sivulla olevia linkkejä. NONE tarkoittaa NOINDEXin ja NOFOLLOWin yhdistelmää."

Onko tuo siis laitettu meta tietoihin sen takia, että etusivulla on uutisia vai mikä idea on olla indeksoimatta etusivua?
 
Pari valistunutta arvausta syystä.

1. Advoline.de ja Advoline.dk osoitteet ovat olemassa joista ei ole linkkiä advoline.fi:hin -> kuukkeli viisaudessaan ihmettelee yritetäänkö samoille apajoille.

2. Sivut ovat palvelinhotellissa, jonka ulos näkyvä ip vie INT2000 etusivulle. ts. INT2000 palvelin tunnistaa host headeristä mitä pitää osoitteelle kysyttäessä näyttää. Tässä ei sikäli ole mitään kummallista mutta ulos ei näe mitä muuta INT2000 tekee välissä roboteille.

Ongelmaa lähtisin purkamaan INT2000 kautta.
 
Se robots meta lause kannattaa ottaa pois. Sen puuttumisesta ei ole haittaa indeksoinnin näkövinkkelistä. robots.txt filessä sitte kertoo mitä EI indeksoida
 
eihän sulla oo ees mitään keywordseja-metatageissa, helpottaisi luultavasti hakukoneiden työtä?
 
Noista keywordeista mä oon nykyisin siinä käsityksessä että hakurobotit nakkaa paskat niillä. Ennemmin kannattaa keskittyä sivujen sisältöön ja tarvittavien avainsanojen sijoitteluun linkkeihin, otsikoihin ja sivujen titleihin jne... Voin toki olla väärässäkin.
 
Quote: http://www.heikniemi.net/kirj/web/robots.html
"Sivun HEAD-osaan sijoitettavalla META ROBOTS -tagilla on mahdollista ohjata hakurobottien toimintaa. Toukokuussa 1996 kokoontuneen W3C:n Indexing Workshopin muistiinpanoissa määritellään tagille neljä eri tilaa: ALL vastaa oletusarvoista tilaa, eli robotit voivat vapaasti indeksoida sivun ja sen linkit. NOINDEX estää hakukonetta indeksoimasta tätä yksittäistä sivua, mutta ei kiellä sivulla olevien linkkien seuraamista (ja mahdollisesti niiden sisällön indeksoimista). NOFOLLOW jättää itse sivun indeksoitavaksi, mutta kieltää seuraamasta sivulla olevia linkkejä. NONE tarkoittaa NOINDEXin ja NOFOLLOWin yhdistelmää."

Onko tuo siis laitettu meta tietoihin sen takia, että etusivulla on uutisia vai mikä idea on olla indeksoimatta etusivua?

Itse en ole todellakaan näitä sivuja tehnyt, joten ei ole vähäisintäkään tietoa koodin sisällöstä. Olen kyllä toimittanut sivun tekijälle keywords listan, mutta mihinkähän se on oikein laitettu...

Nikste, webmastertool ei löydä edes sivuja, niin sillä ei mielestäni voi tehdä mitään.

Selvitetäänpä hieman lisää ja yritetään poistaa nuo robots-tagit... Kiitokset kaikille vastauksista!
 
meta name="distribution" content="Asianajotoimisto Advoline Oy on
Helsingin Kruunuhaassa sijaitseva pienten- ja keskisuurten yritysten
lakiasioihin sekä rikosoikeuteen erikoistunut toimisto. Olemme Suomen
Asianajajaliiton jäsen. Yhteydenotot: asianajaja Tatu Henriksson, p.
045-1300 567"
meta name="robots" content="follow, all"
meta name="language" content="en, sv"

Noi siis ovat tällä hetkellä.
 
En tiedä kuinka suuri merkitys nykyään noilla meta -tiedoilla on, mutta pari kaveria ketkä noita sivuja on väsännyt aika tavalla ovat suositelleet laittamaan kaikkia asiaanliittyviä hakusanoja sinne pilkulla erotettuna.

Tyyliin ensimmäinen hakutulos googlesta hakusanalla "asianajotoimisto":

Koodi:
meta http-equiv="Content-Type" content="text/html; charset=ISO8859-1">
meta http-equiv="Content-Language" content="fi">
meta name=Title content="Asianajotoimisto Kuusivaara">
meta name=Author content=Kuusivaara>
meta name=Description
content="Palveleva asianajotoimisto Helsingissä.Yritysten ja yksityishenkilöiden toimeksiannot.">
meta name=keywords
content="asianajotoimisto, asianajaja, laki, suomen laki, jyrki kuusivaara, oikeus, pykälä, säädös, siviilioikeus, hallinto-oikeus, korkein oikeus, hovioikeus, haaste, syyttäjä, puolustaja, yritysjuristi, juristi, lakiasiaintoimisto, sovinto, sovintomenettely, riita, perintä, perintätoimeksianto, oikeusturva, sopimus, sopimusriita, käräjät, käräjätuomari, syytetty, kantaja, velkajärjestely, juridiikka, ympäristöoikeus, rikos, rikollinen, asianomistaja, asianajosihteeri, lakimies, tuomari, päätös, sovinnollinen ratkaisu, irtaimisto, urakka, urakkasopimus, työoikeus, osakeyhtiö, osakeyhtiölainsäädäntö, rakennusvaurio, homevahinko, iba, international bar association, riskinhallinta, neuvo, vinkki, oikeudenkäyntikulut, avioliitto, avioehto, avioehtosopimus, lähestymiskielto, perikunta, perintö, kuolemantapaus, velkomusasia, ylivelkaantuminen">
meta http-equiv="Page-Enter" content="blendTrans(Duration=2.0)">

meta http-equiv="Page-Exit" content="blendTrans(Duration=3.0)">
meta name=Language content=fi>
meta name=revisit-after content="3 days">

meta name=Robots content="index,follow"
 
meta name="distribution" content="Asianajotoimisto Advoline Oy on
Helsingin Kruunuhaassa sijaitseva pienten- ja keskisuurten yritysten
lakiasioihin sekä rikosoikeuteen erikoistunut toimisto. Olemme Suomen
Asianajajaliiton jäsen. Yhteydenotot: asianajaja Tatu Henriksson, p.
045-1300 567"
meta name="robots" content="follow, all"
meta name="language" content="en, sv"

Tuo kieliasia pistää hieman silmään. Kannattaisi varmaan muuttaa tuohon fi, kun sivut ovat kuitenkin vain suomeksi. Tuon lisäksi siellä alempana on toinen robots tägi:

meta name='robots' content='noindex,nofollow'

...ja tämä on siis se alkuperäinen ongelma. Luulen että alempi tägi yliajaa tuon ylemmän ja siis kieltää Googlen bottia jatkamasta sivujen indeksointia.
 
Tämä on nyt jo ihan käsittämätöntä, sillä Wordpressin hallinnassa headerissa ei ole tuota mikä taas näkyy lähdekoodissa. Nyt ei tajua.

Koodi:
<!-- leave this for stats please -->

link rel="Shortcut Icon" href="<?php echo get_settings('home'); ?>/wp-content/themes/vertigo-squared/images/favicon.ico" type="image/x-icon" 
link rel="alternate" type="application/rss+xml" title="RSS 2.0" href="<?php bloginfo('rss2_url'); ?>" 
link rel="alternate" type="text/xml" title="RSS .92" href="<?php bloginfo('rss_url'); ?>" 
link rel="alternate" type="application/atom+xml" title="Atom 0.3" href="<?php bloginfo('atom_url'); ?>" 
link rel="pingback" href="<?php bloginfo('pingback_url'); ?>" 
?php wp_get_archives('type=monthly&format=link'); ?
?php wp_head(); ?
style type="text/css" media="screen"
!-- @import url( <?php bloginfo('stylesheet_url'); ?> ); -->
/style
/head
 
Mkay, ongelmaan löytyi ratkaisu oheisesta linkistä. Olen väsännyt noin 10 wordpress sivustoa, eikä koskaan ole defaulttina ollut tota homoasetusta päällä. Int2k asensi tämän blogin, joten mahtaako olla sieltä peräisin tuo paska-asetus.

http://wordpress.org/support/topic/121719

Triviaa:

Pakkotoisto.com sai aikanaan kenkäää Int2k:lta kun veimme liikaa resursseja, nykyään palvelu on noin 5 kertaa isompi ja Myvisio pyörittää komeesti.
 
Pakkotoisto.com sai aikanaan kenkäää Int2k:lta kun veimme liikaa resursseja, nykyään palvelu on noin 5 kertaa isompi ja Myvisio pyörittää komeesti.

Pakko sanoa ääneen: En ylläty pätkän vertaa tästä.

Eikös int2k:n päätoimi ole kiinteistöhuolto? Hah.
 
meta name="ROBOTS" content="NOARCHIVE" estää googlea indeksoimasta, eli nyt ei pitäs olla ongelmaa, ainakin mitä advolinen lähdekoodia katoin. noindex estää vaan pääsivua, joilta googlebotti voi taas indexoida linkkejä ja niiden sivuja yms. muistakaahan, ettei google näytä sivuja, joille ei oo linkkiä mistään muusta saitista. esim jos pakkiksella on ainoo linkki ja täällä NOFOLLOW attribuutin arvona, ei google indexoi advolinee.

ps. advonlinen.fissä komeilee pääotsikossa "Utube", oiskohan youtube oikein? samaisen otsikon linkki vie advoline.fihin, eli samalle sivulle mistä lähtikin :) plus, että jokanen uutislinkki (mtv3, karjalainen ja HS) vie hs:n sivuille. kukas teillä noita uutisointeja hoitaa? :jahas:
 

Latest posts

Suositut

Back
Ylös Bottom