уникално съдържание - бързи методи на създаване

happyslacker

New Member
Уникално съдържание чрез замяна на еднаквоизглеждащи букви?

Обяснено по-просто:

Имаме текст на английски:

Now learning Forex trading can be like reading Harry Potter's adventures with Rob Booker's Let author Rob Booker introduce you to Harry Banes.

Набелязваме си думи, които не са ключови. Например думите "can", "be", "Harry", "Potter" и т.н. (тук ключовите думи са: „Forex“, „learning“, „trading“).
Думите, които са ключови не ги пипаме в никакъв случай, а думите, които не са ключови ги обработваме - заменяме латинските букви, които приличат на букви от кирилицата с двойниците си:

Nоw learning Forex trading cаn bе liке rеаding Hаrrу Pоttеr's аdvеnturеs with Rob Booker's Let author Rob Booker introduce you to Harry Banes.

Какво смятате за този метод за генериране на „уникално“ съдържание?
 
Друг метод за избягване на дублиращо съдържание - размяна на словореда:

Код:
Whether you're a day trader, swing trader, or position trader,  .....

Код:
Whether you're a swing trader, position trader, or day trader,  .....

Още една идея - ползване на синоними. За съжаление този метод е малко по-труден за изпълнение, ако не се познава добре езика (понякога ако сложим синоним можем да променим сериозно значението на израза).

Някакви други идеи?

Например разместването на изреченията в даден текст оказва ли сериозно влияние върху „уникалността“ на текста?
 
Няма да има проблеми с енкодинга, защото:

Код:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
   "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
<title>заглавието на страницата</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Ще се ползва utf-8 :idea:

По-скоро ще има проблеми с езика - търсачката няма да знае на какъв език е текста (независимо, че сме декларирали „xml:lang="en" lang="en">“) поради странните символи (в англ. език няма кирилица...). Поради многото неанглийски страници с lang="en" търсачките вероятно си имат свой метод за определяне на езика базиран сложни правила... Доста е вероятно това да доведе до негативни резултати (по-ниско класиране) в търсене на английски текстове (потребители намиращи се на територията на страни, където се говори английски - Google филтрира резултатите от търсенето в зависимост от географското разположение на потребителя).

Това със синонимите е по-трудно (поне за мен), защото изисква повече познаване на езика - може без да искаш да измениш смисъла на израза чрез неподходящ синоним (изваден от речник).
 
Viko каза:
Хах първият метод е доста терикатски сиг. ли си че работи и търсачките вече го приемат като уникален контент ?

Не. Даже имам подозрения, че не е приложим поради причините, които изложих по-горе. Не смятам да го използвам - просто разсъждавам теоретично... и явно търсачките го засичат щом при написване на такива ключови думи със странни символи търсачката казва „Може би имахте предвид: ....“.
 
А какво ще кажете за „белите“ методи за генериране на уникално съдържание - синоними и разместване на думи/изречения?

Google дали ги забелязва?

Има ли някаква по-формална дефиниция за „уникално съдържание“, която да бъде използвана за създаване на алгоритъм, с който да се извършва проверка на текстовете, които пишем?
 
бота като ти го индексира като шлокавица не виждам какъв е смисъла да се опитваш да избегнеш дублирането :lol: пълни глупости са това. Из лично го избягвам като размествам пасажи и ползам стронг тагове по цялата тема :wink: незная дали има особенно голяма полза, но за момента явно има :wink: :arrow:
 
H1pNoTiC каза:
като размествам пасажи и ползам стронг тагове по цялата тема :wink: незная дали има особенно голяма полза, но за момента явно има :wink: :arrow:

Колко големи пасажи? Интересно къде е границата в размера на пасажите, които се разместват - десет думи, едно изречение, 164 символа....

Сетих се и за друг начин: заместват се изрази като „You'll“ -> „You will“, „What's this“ -> „What is this“ и т.н. Обаче не знам как това се приема от читателите (за които английският език е роден)...
 
Бърз начин за намиране на синоними (може да се автоматизира?) - търсят се думи, които започват с un и un се заменя с „not “ (not последван от интервал!).

Пример: „unprepared“ -> „not prepared“.

Обаче има много изключения... Трябва явно да се прави списък с думи, при които това правило (алгоритъм!) работи...

Може би когато бях ученик е трябвало повече да наблягам повече на английския вместо на електрониката и четенето на интересни книги... :oops:

Машинната обработка на естествени езици е интересна именно поради невъзможността си за реализация (принципна невъзможност). Интересното е до къде можем да стигнем :) До колко можем да се доближим до създаването на алгоритъм, който ще обработва текст като човек...
 
happyslacker каза:
H1pNoTiC каза:
като размествам пасажи и ползам стронг тагове по цялата тема :wink: незная дали има особенно голяма полза, но за момента явно има :wink: :arrow:

Колко големи пасажи? Интересно къде е границата в размера на пасажите, които се разместват - десет думи, едно изречение, 164 символа....

Сетих се и за друг начин: заместват се изрази като „You'll“ -> „You will“, „What's this“ -> „What is this“ и т.н. Обаче не знам как това се приема от читателите (за които английският език е роден)...

Как да се приема ? Това си е съвсем в норма.
 
Няма ли да е странно за американец да прочете „What is this“ вместо „What's this“. Имам предвид, че второто изисква натискане на повече клавиши и вероятно не се прилага често...

Сам си отговарям: не. Резултатите (Google) са почти еднакви:

Резултати 1 - 10 от около 11 800 000 за "What's this". (0.12 секунди)
Резултати 1 - 10 от около 10 500 000 за "What is this". (0.17 секунди)

А разместването на пасажи как го виждат търсачките? Какви са критичните размери на пасаж за да бъде съдържанието неуникално от гледан точка на търсачките?
 
Още един бърз метод :idea: - замяна на числата с думи и обратно:

...to deliver ten key practices...

става

...to deliver 10 key practices...
 
H1pNoTiC каза:
размествам пасажи и ползам стронг тагове по цялата тема

Ясно е, че таговете за форматиране на текста (удебеляване, накланяне, подчертаване) ще вдигнат позицията на страницата при търсене с ключова дума, която се съдържа в таговете. Но е интересно друго - дали таговете водят до увеличаване уникалността на съдържанието? Нямам предвид само таговете за промяна характеристиките на шрифта. Таговете за абзац (

), списъци (<ul>, [*],
  1. ) и др.

    За списъците знам, че ако се махнат и на тяхно място се сложат звездички или други символи (за неномерираните списъци) и чила (за номерираните) това ще се брои за уникално съдържание.

    Пример:

    • Ред 1
    • Ред 2
    • Ред 3

    - Ред 1
    - Ред 2
    - Ред 3

    > Ред 1
    > Ред 2
    > Ред 3

    » Ред 1
    » Ред 2
    » Ред 3

    Най-вече за абзаците е интересно...
 
Аз имам един въпрос .. Този пример където си дал
Whether you're a day trader, swing trader, or position trader, .....
и го промениш на
Whether you're a swing trader, position trader, or day trader, .....
търсачките ще го приемат ли за уникален само защото си разменил мястото на думите ? Не трябва ли и малко промени - синоними и т.н. А и примерно на едно изречение от 20 думи променим само две думи с техни синоними ще се счита ли за уникален контент ?
 
Понякога няма как да се ползват синоними без да се промени смисъла на текста...

Иначе и аз търся отговор на този въпрос :)

Също така друг интересен въпрос - дали търсачките ще вдигнат страницата ни в резултатите, ако имаме дублирано съдържание, което обграждаме с често променящо се и почти уникално (или уникално) съдържание?

Предполагаем отговор: да, но сериозен ефект се наблюдава когато сайта има голям PR и то толкова голям, че да счита всички други сайтове за плагиати :)

Ето това как действа на практика:
Компилиране на kudzu (разни неща, които бях писал през 2004 година в пощенския списък lug-bg)

Вижда се, че osdir.com е по-напред от mail-archive.com. Причината е, че първия сайт слага често обновяващо се съдържание на страниците. Сайтовете също така ползват методи за вдигане на PR. Интересен метод за ползване на безплатно съдържание...
 
Аз за друго говоря. Пазаж е все едно един куплет от песен :lol: абзац е точната дума. Думи в изречение незная дали има толкова голям ефект.

Например в моя сайт за коли ако източника е започнал ревюто на даден автомобил с екстериора, аз започвам с техническите данни, но това си е пак вид преразказване, и не винаги става разбира се. Зависи за какво пишеш щото например ако имаш блог за филми не върви първо да разкажеш как свършва и после да пишеш как започва филма.

За таговете голямо значение имат H така и болда, за другите незная.
 

Горе