Меню Рубрики

Поиск по синонимам битрикс

Эксзибит, прокачай мне внутренний поиск по интернет-магазину!

Ненайденный товар — не купленный товар. Это касается не только выдачи поисковых систем, в которых все стараются забраться повыше, но и внутреннего поиска в интернет-магазине. Эта статья о том, как сделать лучше поиск на 1С-Битрикс. Идея, описанная в статье, простая, не требует участия программиста. Сгодится и для других CMS, но примеры в статье будут именно про Битрикс

Поиск по товарам в интернет-магазине — очень полезный сервис, есть на большинстве магазинов. Критически важно чтобы он работал правильно и выполнял свою задачу — помогал находить товары в вашем каталоге. Перед тем как сделать покупку или положить товар в корзину, посетитель пользуется поиском. Особенно если каталог большой.

На практике, поиск в интернет-магазинах работает плохо. Он есть, что-то даже находит, но ищет не лучше чем инспектор Лестрейд в книге о Приключениях Шерлока Холмса. Чуть что не так, сразу страница «Товары не найдены». Посмотрите статью о том что показывать на страницах с системными сообщениями, типа «404 — не найдено», «Корзина пуста» и т.п..

Пока поиск, встроенный в CMS магазинов далек от совершенства, современные поисковые системы приучают пользователей задавать поисковый запрос на все более естественном языке. Имея такой опыт общения с поисковиками, посетители интернет-магазина ожидают такого же «уровня понимания» от менее совершенного поиска в интернет-магазине и если ничего не нашли не утруждаются переформулированием запроса, просто закрывают вкладку браузера и идут дальше.

Одна девочка так боялась растолстеть, что не надевала толстовок, а носила только худи.

Ищет человек в магазине одежды «Худи», в то время как все худи названы толстовками и находятся в соответствующем разделе. Не удивительно, что посетители товары не находят. Но если в этом примере все же проблема больше в названии товара, а не в поиске (знающие люди умеют отличать толстовку от худи), то в случае с жаргонизмами и синонимами в поиске — беда.

Если в описании или характеристиках товара искомое слово не упомянуто — поиск по сайту его точно не найдет.

То же самое с названием брендов, написанных на русском. Далеко не в каждом магазине одежды вы сможете найти бренд «Адидас» или «Найк», хотя товары этих брендов у них есть, просто написаны на английском — «Nike».

Или бывает, что человек не знает, как называется товар и ищет «своими словами».

Приведу пример. Когда в магазине женского белья мы добавили к товару с названием «Пестис» синоним «наклейка на соски», их стали лучше покупать, потому что товар стал искаться и в поисковых системах и поиском на сайте. Люди просто не знали «как эти штуки называются».

Я не призываю набивать синонимами описание товара, хотя в пределах разумного использовать в карточке синонимы нужно.

Но чтобы улучшить поиск по интернет-магазину и обеспечить покупателю нахождение товара, функционалу «Поиск» нужно уделять внимание. Проверять, как он ищет, все ли, соответствующие запросу товары находит. Проверять не только по прямому запросу, но и поиск по синонимам и жаргонизмам.

Жаргонизмы и синонимы – особенно хорошо заметны в компьютерной теме. Там практически каждое устройство и железка называется нескольким названиями да еще написать можно и кириллицей и латиницей. То же в теме одежды. Одна вещь может называться по-разному или цвет вещи разные люди могут называть по-разному. Кому-то «розовый», кому-то «алый» или «коралловый». Другие будут задавать запрос «Платье большого размера», вместо того чтобы указать конкретный размер. Нужно чтобы предпокупочный поиск по сайту выдавал то, что ожидает покупатель.

В случае с Битриксом вопрос улучшения поиска решается довольно просто. Конечно, поиск не станет таким же умным, как Яндекс, но ему этого и не надо. Достаточно находить товары по основным синонимам, аналогам названий и цветов.

Что именно делать

Для этого создаем в инфоблоке каталога товаров еще одно свойство (тип «Строка»), называем его, например, «Синонимы для внутреннего поиска» (или как захотите), не забываем поставить галочку, чтобы сделать его индексируемым. После, в настройках страницы добавления товара делаем это поле видимым, чтобы контент-менеджер мог его заполнять. Можно сделать его обязательным для заполнения, тогда сократится шанс забыть/забить его заполнить.

Примерно так это поле будет выглядеть в админке, после того как вы его добавите.

На видео показано как добавлять поле. Также видно, что до его добавления и заполнения, товар с названием «Штаны «Полосатый рейс» не находились поиском по запросу «полосатые штаны», а после стали находиться.

Я писал этот абзац дольше, чем в реальности все перечисленные действия делаются мышкой. Не буду расписывать, как это сделать пошагово (хотя это есть на видео). Если вы не умеете, лучше попросите того кто умеет, чтобы случайно ничего не отломать.

Далее, предстоит большая и скучная работа. Каждый раз при добавлении / редактировании товара, в новом поле прописываются все синонимы, по которым этот товар должен находиться внутренним поиском интернет-магазина. Просто перечисляете через запятую список слов-синонимов, жаргонизмов, аналогов цвета, разности написания, по которым он должен искаться. Например, для «Сетевой карты» можно указать «сетевуха» и «network card». Для HDD-диска пишем «Винчестер», «Винт», «Хард», «Hard» и т.п. Для розового платья добавляем синонимы цвета «коралловый» и «алый». Всем англоязычным брендам дополнительно прописываем названия кириллицей (предварительно проверив, как большинство людей в интернете его ищут на кириллице).

Тем, кто до сих пор не понял о чем речь и напрягся, подумав, что за такие вещи Яндекс с Гуглом дружно наложат санкции — расслабьтесь, ничего страшного в этом нет. В публичную часть информацию из этого поля выводить не нужно. Все что вы в нем напишите, будет использоваться только внутренним поиском вашей CMS (а он вас не забанит :-).

Возможно, есть облачный сервис, который решает проблему поиска в интернет-магазине (чтобы искал с учетом морфологии, по синонимам, позволял выгружать в него остатки по складам, чтобы искать только по товарам в наличии и т. п.). Мне такой неизвестен. Если знаете – напишите в комментах. Или дарю идею для стартапа.

Можно поставить поиск от Яндекса или Гугла, но искать он будут не по актуальной базе товаров (товар распродан, а в поиске будет торчать), что для магазина, конечно, не гуд. Даже обновленный поиск Яндекса (который теперь стал SAAS-сервисом) не решает проблему.

UPD: Яндекс запустил поиск по интернет-магазинам. Не иначе кто-то там читает мой бложик и делает правильные выводы 🙂

Источник статьи: http://webdela.ru/blog/fishki/vnutrenniy-poisk-po-internet-magazinu/

Используем синонимы для улучшения поиска по сайту на «Битрикс»

Если у вас возникли какие либо вопросы которые вы не смогли решить по нашим публикациям самостоятельно,
то ждем ваше обращение в нашей службе тех поддержки.

Поиск «Битрикс» хорош. Но не идеален. И на большинстве сайтов явно не дотягивает до уровня поисковых машин Яндекс и Google. Поиск «Битрикс» по сайту не умеет обучаться сам. Значит, надо ему помогать вручную. Иначе вы не сможете продать USB-накопители, если посетители будут искать флешки. И наоборот. Как повысить эффективность поиска по сайту?

1. Создадим поле для ввода синонимов

Инфоблоку товаров добавим еще одно свойство. Назовем его «Синонимы для поиска по сайту». Назначим текстовый тип и поставим галочку, чтобы записи этого поля индексировались внутренним поиском. Определим его как обязательное для заполнения.

2. Где брать синонимы?

Теперь при добавлении нового товара оператор должен будет обязательно заполнить синонимы через запятую. В помощь тут будут Яндекс Wordstat, выдача Яндекса и Google, отзывы на Яндекс.Маркете, сайты конкурентов. Например, если краска бирюзовая, можно добавить синонимы «зеленая», «зеленоватая», «сине — зеленая». Для клавиатуры, естественно, добавим «клава», «батон», для материнской платы «мать». Если названия или имена производителей на других языках (например, английском), обязательно добавляйте варианты на русском языке. «Nike» — «Найк», «Android» — «Андроид» и так далее.

3. Не бойтесь поисковых санкций

Но и не подставляйтесь под них. Синонимы и жаргонизмы должны применяться исключительно для внутреннего поиска. Индексация поисковыми машинами Яндекс и Google должна быть запрещена. Позаботьтесь об этом.

4. Не вводите в заблуждение

У вас будет искушение поспамить в список синонимов, подсовывая посетителям «почти то», «похоже», или «совсем не то, но вдруг купят». Купят мало, зато поймут, что поиск работает «не так» и перестанут им пользоваться. Или вообще уйдут от вас.

5. Варьируйте разные параметры

Добавляйте кириллические синонимы не только к бренду, но и к размеру, цвету, названиям протоколов. Ищите, расспрашивайте.

6. Находки для поисковой оптимизации

В пункте 3 мы предупреждали, что списки синонимов должны быть недоступны для индексации «большими» поисковыми машинами. Из этого правила есть исключения: единичные, популярные у покупателей и релевантные синонимы можно и нужно выводить в мета-теги для индексации Яндекс и Google. Это улучшит положение в выдаче и посещаемость.

Источник статьи: http://www.acrit-studio.ru/pantry-programmer/useful-tips-for-configuring-1c_bitrix/use-synonyms-to-improve-search-results-for-website-on-bitrix/

Нечеткий поиск: поиск с учетом синонимов и обработкой ошибок пользователей

Скриншоты

Технические данные

Совместимые редакции

Описание

Решение расширяет базовый функционал стандартного модуля «Поиск» от Битрикс, позволяя эффективно обрабатывать синонимичные значения, опечатки и ошибки в поисковым запросе. Высокая эффективность модуля обеспечивается комбинированной работой различных алгоритмов поиска по сходству ( fuzzy string search ) и компьютерной лингвистики.

Модуль включает в себя следующие функциональные блоки

Расширение выборки. Из исходного запроса строится множество «ошибочных» слов, для каждого из которых затем производится точный поиск в словаре.
Поиск по сходству.
Поиск по словарю синонимов.
Обработка поисковых запросов пользователей. Анализируется поисковая статистика, обрабатываются те запросы, для которых не нашлось ни одного совпадения.
Установка и настройка модуля проста и не требует специальных знаний. Одновременно с этим, модуль предоставляет систему настроек, рассчитанную на самых взыскательных пользователей. Все настройки модуля подробно объяснены и задокументированы.
В комплекте с модулем поставляются компоненты catalog.search, search.title и search.page, которые, работая в «нечетком» режиме, повторяют функционал и шаблоны одноименных стандартных компонентов.
Комбинация различных алгоритмов нечеткого поиска
Анализ статистики поисковых запросов
Совместимость со Sphinx
Гибкая система настроек
Возможность ограничения зоны действия модуля
Совместимость как с UTF-8, так и с Windows-1251
Словарь 80 000+ синонимов
Подробная документация
Установка и настройка модуля

Установите решение
Выберите опции модуля на вкладке Настройки продукта > Настройки модулей > Нечеткий поиск
Запустите переиндексацию
Если используется режим поиска по сходству, замените компоненты bitrix:catalog.search, bitrix:search.title и bitrix:search.page на одноименные компоненты модуля
Требования к ПО

Php >= 5.6.0
Mysql >= 5.6

В требованиях указана протестированная конфигурация.

Если хостинг не удовлетворяет указанным требованиям, то напишите в нашу техническую поддержку, мы проверим совместимость модуля конкретно с Вашим ПО.

Расширение поисковой выборки

Исходный поисковый индекс Bitrix искусственно расширяется: строится множество «ошибочных» слов, а также слов-синонимов (опционально). Таким образом, если пользователь введет поисковый запрос с ошибкой, который ранее попал в расширенный индекс, ему будет автоматически возвращена релевантная выдача. Данный режим не требует изменений стандартных компонентов.

Ниже рассмотрен пример работы модуля с индексируемым словом «платье».

При ошибочном поисковом запросе проиндексированные данные последовательно сравниваются с запрашиваемой строкой, ищутся максимально похожие на основании расстояния Левенштейна.

Доступно сравнение на основании стемминга (морфологический основ) и metaphone (фонетического звучания).

Для работы в режиме поиска по сходству, модуль использует как стандартный индекс Bitrix, так и собственные таблицы индексации.

Данный режим требует замены стандартных компонентов bitrix:catalog.search, bitrix:search.title и bitrix:search.page на одноименные компоненты модуля.

Обработка поисковых запросов пользователей

При включенной опции «Собирать статистику по поисковым фразам» модуля «Поиск» будет производиться автоматический сбор информации по поисковым запросам пользователей. Ознакомиться с собранной статистикой можно на вкладке Настройки > Поиск > Статистика > Список фраз. Модуль «Нечеткий поиск» расширяет данный функционал, выбирая из статистики те запросы, для которых не нашлось ни одного совпадения. Фразы запросов разбиваются на отдельные слова, для слов находятся морфологические основы. При индексации данных на сайте выделенные морфологические основы будут сравниваться с основами индексируемых слов, близкие основы будут добавлены в индекс.

Пользователь ввел поисковый запрос с опечаткой «фцтболка». Для данного запроса на сайте не было найдено совпадений, запрос попал специальную таблицу модуля «Нечеткий поиск». На сайте есть проиндексированное слово «футболка». Поскольку основа слова «футболка» близка к основе слова «фцтболка», происходит расширение поискового индекса.

Теперь при запросе «фцтболка» пользователю будет возвращены данные, соответствующие поисковому индексу для «футболка».

Функционал включается/отключается опцией «Добавлять к индексу поисковые фразы» модуля «Нечеткий поиск» на вкладке Общие настройки.

Функционал будет работать только при включенной опции «Собирать статистику по поисковым фразам» модуля «Поиск».

Функционал работает как в режиме I «Расширение выборки», так и в режиме II «Поиск по сходству».

Описанное выше сравнение морфологических основ подчиняется общим правилам сравнения, задаваемым в настройках модуля «Нечеткий поиск» на вкладке Общие настройки.

Ознакомиться с обработанными поисковыми фразами мы можете на вкладке Настройки > Нечеткий поиск > Обработанные поисковые фразы.

У пользователя есть возможность деактивировать часть обработанных фраз на вкладке Настройки > Нечеткий поиск > Обработанные поисковые фразы. Деактивированные данные не будут учитываться при индексации.

Модуль «Нечеткий поиск» предоставляет удобный функционал для поиска по синонимам. Синонимы добавляются к поисковому индексу в случае, если морфологическая основа какого-либо слова из индекса совпадает с основой слова из таблицы синонимов.

Вместе с модулем поставляется обширный словарь синонимов, который пользователь может добавлять самостоятельно. Список синонимов смотрите в разделе Настройки > Нечеткий поиск > Словарь синонимов.

Допустим, что в поисковый индекс попало слово «футболки», при этом в словаре активна запись для слова «футболка» с синонимами «рубашка, майка».

Морфологические основы слов «футболки» и «футболка» совпали, поэтому слова «рубашка» и «майка» расширят поисковую выдачу для «футболки».

Функционал синонимов включается и отключается опцией «Добавлять к индексу синонимы» в настройках модуля «Нечеткий поиск» на вкладке Общие настройки.

У каждой записи словаря синонимов есть флаг активности. Деактивированные синонимы не будут участвовать в поиске.

Пользователь может настроить использование только своих собственных синонимов, исключив словарь, поставляемый вместе с модулем. Для этого необходимо включить опцию «Использовать словарь синонимов пользователя» и отключить «Использовать словарь синонимов по умолчанию» в настройках модуля «Нечеткий поиск» на вкладке Общие настройки. Обратным действием можно исключить словарь собственных синонимов.

Данный функционал есть в стандартных компонентах bitrix (параметр «Включить автоопределение раскладки клавиатуры»), и он сохранен в компонентах модуля.

Это позволяет, например, обработать ситуацию, когда пользователь ввел в строку поиска «gkfnmt» вместо «платье».

Кроме того, в настройках модуля доступен режим сравнения по фонетическому сходству, что позволяет корректно обработать созвучные запросы разных языков, например «platie» вместо «платье».

Источник статьи: http://www.acrit-studio.ru/market/module/tega.fuzzysearch/


0 0 голоса
Article Rating
Подписаться
Уведомить о
guest

0 Комментарий
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии