Форум об интернет-маркетинге
Вернуться   Форум об интернет-маркетинге > Не про работу > Курилка

Курилка Автомобили, хобби, спорт. И Garik77 с металлоискателем. Коммерция запрещена.

Ответ
 
Опции темы
Старый 17.10.2025, 20:57   #41
HappySoftX
Senior Member
Доцент
 
Аватар для HappySoftX
 
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,960
Получил(а) "Спасибо": 2,556
Нарушения: 0/0 (0)
Репутация: 80425

Thread Starter Re: И снова об ИИ

Не пишут, серьезно?
Яндекс маркет

Сайлентблок передний рычага переднего для а/м SKODA OCTAVIA III; VW TIGUAN, MOBILAND 142101120

Сайлентблок рычага передней подвески передний Sasic 9001523 для а/м Volkswagen Polo, AUDI A3, SKODA Fabia

Сайлентблок переднего рычага переднй для автомобиля VW Polo (09 ) TRIALLI SB 1840

---
ээээ и что ты хотел доказать, у тебя у самого в прайсе
сайлентблок ford transit рычага переднего задний
сайлентблок ford transit рычага переднего передний

---
офисный пакет не устраивает поскольку это хрень будет. мне автоматизация нужна а не макросы писать под каждого поставщика и постоянно их допиливать.
И да мы говорили про нечеткий поиск, который легче протестировать на питоне одной командой.
HappySoftX вне форума   Ответить с цитированием
Старый 18.10.2025, 00:35   #42
burunduk
попробуй отними
Профессор
 
Аватар для burunduk
 
Регистрация: 14.07.2020
Сообщений: 911
Сказал(а) спасибо: 1,129
Получил(а) "Спасибо": 2,182
Нарушения: 0/0 (0)
Репутация: 757769

По умолчанию Re: И снова об ИИ

HappySoftX, ты серьёзно не видишь разницы?
между общеупотребительными словами и конкретным указанием марки машины, более того я специально указал что к каждому названию есть ещё и название марки машины + артикул (по каталогу производителя данного автомобиля), т.е. это абсолютно однозначное определение

Цитата:
Сообщение от HappySoftX Посмотреть сообщение
офисный пакет не устраивает поскольку это хрень будет. мне автоматизация нужна а не макросы писать под каждого поставщика и постоянно их допиливать.
это говорит только о том что ты вообще не знаешь офисного пакета, только на уровне найти в списке программ excel, word... и не более

P.S. питон это язык для чайников, которые сами толком ничего написать не могут, а пользуются готовыми библиотеками, т.е. любой код написанный на питоне выполняется в несколько раз дольше!


именно поэтому его поддержку включили в excel т.к. он не требует глубокого понимания именно то что и требуется чайникам

у нас на работе уволили такого, т.к. он не понимал что делал код и почему он выдавал некорректные данные
burunduk вне форума   Ответить с цитированием
Старый 18.10.2025, 06:18   #43
HappySoftX
Senior Member
Доцент
 
Аватар для HappySoftX
 
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,960
Получил(а) "Спасибо": 2,556
Нарушения: 0/0 (0)
Репутация: 80425

Thread Starter Re: И снова об ИИ

Цитата:
Сообщение от burunduk Посмотреть сообщение
HappySoftX, ты серьёзно не видишь разницы?
между общеупотребительными словами и конкретным указанием марки машины, более того я специально указал что к каждому названию есть ещё и название марки машины + артикул (по каталогу производителя данного автомобиля), т.е. это абсолютно однозначное определение
Ты бы сформулировал, свой тезис. Я тебе привел пример где нечеткий поиск не сработает. Ты начал доказывать что так не пишут. Я тебе дал ссылкку на яндекс маркет где пишут именно так как я говорил. Теперь приплел марки машины и артикулы.

Цитата:
Сообщение от burunduk Посмотреть сообщение

это говорит только о том что ты вообще не знаешь офисного пакета, только на уровне найти в списке программ excel, word... и не более

P.S. питон это язык для чайников, которые сами толком ничего написать не могут, а пользуются готовыми библиотеками, т.е. любой код написанный на питоне выполняется в несколько раз дольше!

именно поэтому его поддержку включили в excel т.к. он не требует глубокого понимания именно то что и требуется чайникам

у нас на работе уволили такого, т.к. он не понимал что делал код и почему он выдавал некорректные данные
Питон для чайников. Серьезно. Не путай низкий порог входа с для чайников. Реально рассмешил. А вообще расскажи это гуглу, ютубу, nasa опенаи и т.д. Питон используется в науке, для машинного обучения, автоматизации и т.д.

Эксел сам по себе в реальных задачах слаб для серьёзных вычислений. Питон в эксел это не для чайников, а чтобы эксел наконец то перестал быть инструментом для чайников.

Насчет питон медленный, извини но ты опять не понимаешь о чем говоришь. Питон это не язык вычислений. а инструмент управления библиотеками. Обработать данные с помощью питона в CUDA это секунды, та жа задача в эксел минуты, часы, дни.

--
Возвращаясь к нечеткому сравнению. В питоне можно наглядно показать какой процент будет для фраз при нечетком сравнении. Чтобы было понятно почему нечеткое сравнение не подходит для заявки.
HappySoftX вне форума   Ответить с цитированием
Старый 18.10.2025, 09:30   #44
vastmanager
ОПТимизирую оптом.
Академик
 
Аватар для vastmanager
 
Регистрация: 26.06.2020
Сообщений: 1,211
Сказал(а) спасибо: 1,519
Получил(а) "Спасибо": 3,260
Нарушения: 0/0 (0)
Репутация: 996513

По умолчанию Re: И снова об ИИ

Не понимаю о чём спор. Есть же готовые решения по поиску в базах данных.
Вот например программа "Букварикс". Вбил в неё по сайлентблокам для ниссан.
За долю секунды сделала выборку из 2 млрд. строк. Программа эта для работы с поисковыми запросами.
Ну, базу запчастей в неё поместите. Там же не 2 млрд. позиций, я уверен.
Будет работать мгновенно.

vastmanager вне форума   Ответить с цитированием
Старый 18.10.2025, 11:20   #45
HappySoftX
Senior Member
Доцент
 
Аватар для HappySoftX
 
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,960
Получил(а) "Спасибо": 2,556
Нарушения: 0/0 (0)
Репутация: 80425

Thread Starter Re: И снова об ИИ

Цитата:
Сообщение от vastmanager Посмотреть сообщение
Не понимаю о чём спор. Есть же готовые решения по поиску в базах данных.
Вот например программа "Букварикс". Вбил в неё по сайлентблокам для ниссан.
За долю секунды сделала выборку из 2 млрд. строк. Программа эта для работы с поисковыми запросами.
Ну, базу запчастей в неё поместите. Там же не 2 млрд. позиций, я уверен.
Будет работать мгновенно.
Речь про автоматизацию, то есть система которая будет заниматься заказом не имеет права на ошибку, иначе в трубу вылетишь. Поиск по вхождению для запчастей не подходит. Наличие слов не указывает на конкретную запчасть. Нужна обработка прайса по смыслу.
HappySoftX вне форума   Ответить с цитированием
Старый 18.10.2025, 11:23   #46
burunduk
попробуй отними
Профессор
 
Аватар для burunduk
 
Регистрация: 14.07.2020
Сообщений: 911
Сказал(а) спасибо: 1,129
Получил(а) "Спасибо": 2,182
Нарушения: 0/0 (0)
Репутация: 757769

По умолчанию Re: И снова об ИИ

Цитата:
Сообщение от HappySoftX Посмотреть сообщение
Я тебе привел пример где нечеткий поиск не сработает.
если ты настолько туп что проводишь поиск только по полю названия по всему объёму прайсов, то дальше не о чем и говорить

или это не ты такой тупой, а твой ИИ с его библиотеками написанными для совершенно других задач?




Цитата:
Сообщение от HappySoftX Посмотреть сообщение
Ты начал доказывать что так не пишут. Я тебе дал ссылкку на яндекс маркет где пишут именно так как я говорил
во-первых там пишут совсем не так, а с указанием марки/размера/характеристик...
во-вторых, идиотов на маркете всегда было много и это совсем не площадка для поиска автозапчастей
в-третьих, мы находимся всё-таки на форуме связанным хоть чуть-чуть с поиском и не знание простейших принципов поиска уже существующих говорит не в твою пользу, что тебе мешает при нечётком сравнении использовать триплеты?

а о том что ты не понимаешь что делаешь говорит именно то что ты желаешь просто одной командой получить качественный результат - так не бывает

Цитата:
Сообщение от HappySoftX Посмотреть сообщение
Теперь приплел марки машины и артикулы.
интересно у кого это прайс состоит только из названия и цены?

Цитата:
Сообщение от HappySoftX Посмотреть сообщение
А вообще расскажи это гуглу, ютубу, nasa опенаи и т.д. Питон используется в науке, для машинного обучения, автоматизации и т.д.
правильно, там с ним работают чайники, которые с программированием абсолютно не дружат и используют готовые библиотеки написанные другими

пойми область применения языка без строгой типизации очень сильно ограничена, да это иногда удобно, но это серьёзно повышает шанс ошибок и очень замедляет вычисления

Цитата:
Сообщение от HappySoftX Посмотреть сообщение
та жа задача в эксел минуты, часы, дни
это потому что ты не знаешь эксель от слова совсем
а для серьёзных вычислений используют например R, а не питон

Цитата:
Сообщение от vastmanager Посмотреть сообщение
За долю секунды сделала выборку из 2 млрд. строк
а он не понимает что запрос работает всегда быстрее, вероятно он просто запросы писать не умеет, я уже не говорю о сложных преобразованиях в запросах
burunduk вне форума   Ответить с цитированием
Старый 18.10.2025, 11:55   #47
HappySoftX
Senior Member
Доцент
 
Аватар для HappySoftX
 
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,960
Получил(а) "Спасибо": 2,556
Нарушения: 0/0 (0)
Репутация: 80425

Thread Starter Re: И снова об ИИ

С таким подходом действительно спорить смысла нет. Grok

Изучи спор на форуме по двум ссылкам ниже и дай оценку кто прав, а кто болтун
https://se.guru/showthread.php?t=6644&page=4
https://se.guru/showthread.php?t=6644&page=5

Цитата:
### Краткий обзор спора

Спор происходит в теме "И снова об ИИ" на форуме об интернет-маркетинге (страницы 4 и 5). Основные участники: **HappySoftX** (инициатор темы, который делится опытом использования ИИ для автоматизации обработки прайс-листов автозапчастей) и **burunduk** (критикует подход, утверждая, что задача простая и решаема без ИИ с помощью нечеткого сравнения строк, словарей и инструментов вроде Excel). В конце вмешивается **vastmanager** с предложением готового инструмента ("Букварикс"), но это не меняет сути спора.

- **HappySoftX** аргументирует, что обработка прайсов — сложная задача: названия запчастей полны вариаций (синонимы вроде "сайлентблок" / "втулка" / "резинометаллический шарнир"), хаотичного порядка слов, сокращений, опечаток, противоречий в моделях/артикулах. Нечеткое сравнение (fuzzy matching) не справляется, потому что работает на уровне символов, а не смысла. Он использует ИИ (вероятно, embeddings или LLM), который обрабатывает прайс за ночь вместо 3 дней вручную. Приводит реальные примеры из Яндекс.Маркета и подчеркивает, что автоматизация должна быть безошибочной, чтобы избежать убытков.

- **burunduk** настаивает, что все просто: 90%+ случаев решается нечетким сравнением, словарями синонимов и выделением характеристик (марка, артикул). Обвиняет оппонента в "тупости" и незнании инструментов (Excel, Power Query). Утверждает, что ИИ — для "чайников", Python медленный, а задача — максимум 5 минут + пара часов на нормализацию. Приводит примеры из прайсов, но игнорирует семантические нюансы.

- **vastmanager** предлагает поиск по вхождению в базах (как в "Букварикс"), но HappySoftX парирует, что это не подходит — нужен семантический анализ, а не простое совпадение слов.

### Оценка аргументов

#### HappySoftX: прав (практик с реальным опытом)
- Его аргументы основаны на реальных проблемах отрасли автозапчастей: прайсы от поставщиков — это хаос (разные формулировки, синонимы, мусор в названиях). Например, "Сайлентблок передний рычага заднего" и "Сайлентблок переднего рычага задний" — разные запчасти, но fuzzy matching даст высокий процент совпадения из-за похожих символов. А одинаковые по смыслу фразы с переставленными словами ("Сайлентблок рычага передний задний" vs. "Задний сайлентблок переднего рычага") дадут низкий процент.
- Он признает сложность и использует ИИ для семантического анализа (что логично: современные модели вроде embeddings в Python-библиотеках типа fuzzywuzzy или sentence-transformers справляются с этим лучше, чем чистая строковая логика).
- Предлагает протестировать на Python, приводит примеры из реальных источников (Яндекс.Маркет). Его подход масштабируем и автоматизирован, без постоянного "допиливания" под каждого поставщика.
- Минус: не углубляется в детали своего ИИ-решения, но это не ослабляет аргументы — он фокусируется на проблеме, а не на хвастовстве.

#### burunduk: болтун (теоретик с упрощениями и агрессией)
- Упрощает проблему: утверждает, что fuzzy matching дает "99,9% совпадения" в идеальных случаях, но игнорирует реальный хаос (синонимы, опечатки, контекст). Его примеры прайсов — "чистые" с артикулами, но в реальности артикулы тоже варьируются (каждый поставщик пишет по-своему, как отметил HappySoftX).
- Обвиняет в "тупости" и незнании (Excel, Python для "чайников"), но сам предлагает примитивные решения: пользовательскую функцию в Excel для подсчета совпадающих символов (это базовый Levenshtein distance, который не учитывает семантику). Говорит о "триплетах" и словарях, но это требует ручной работы и не решает 100% случаев — а HappySoftX подчеркивает нулевую tolerance к ошибкам.
- Критикует Python как "медленный" и "для чайников", но это болтовня: Python — стандарт для data science/ML (используется Google, NASA, OpenAI). Медленность решается библиотеками (NumPy, Pandas, CUDA для ускорения). Его пример с увольнением "питониста" — анекдот, не аргумент.
- Плюс: правильно отмечает, что 90%+ можно нормализовать автоматически, но преувеличивает простоту и игнорирует оставшиеся 10% (которые критичны для бизнеса).
- Общий стиль: агрессивный, с переходами на личности ("ты туп", "чайник"), что типично для болтуна, который маскирует слабые аргументы эмоциями.

#### vastmanager: нейтральный, но не в теме
- Предложение полезное для простого поиска, но не решает семантическую проблему (как отметил HappySoftX). Это не делает его болтуном, просто не полный вклад в спор.

### Итог: кто прав, а кто болтун
- **Прав HappySoftX**: Его позиция реалистична, подкреплена примерами и пониманием отрасли. ИИ — подходящий инструмент для семантической нормализации, где традиционные методы (fuzzy, словари) недостаточны. Он решает реальную задачу бизнеса (автоматизация без ошибок), а не теоретизирует.
- **Болтун burunduk**: Переоценивает простоту, игнорирует нюансы, использует оскорбления вместо фактов. Его подход работает для простых случаев, но не масштабируется на "грязные" данные без ручного вмешательства. Это классический "диванный эксперт", который хвастается знанием Excel, но не учитывает контекст.

Если спор продолжится, рекомендую HappySoftX поделиться кодом/примерами ИИ-решения — это укрепит позицию. А burunduk — протестировать свои методы на реальных "хаотичных" прайсах, а не на идеализированных.
HappySoftX вне форума   Ответить с цитированием
Старый 18.10.2025, 12:05   #48
burunduk
попробуй отними
Профессор
 
Аватар для burunduk
 
Регистрация: 14.07.2020
Сообщений: 911
Сказал(а) спасибо: 1,129
Получил(а) "Спасибо": 2,182
Нарушения: 0/0 (0)
Репутация: 757769

По умолчанию Re: И снова об ИИ

Цитата:
Сообщение от HappySoftX Посмотреть сообщение
Речь про автоматизацию
так именно excel в данном случае лучшее средство автоматизации
burunduk вне форума   Ответить с цитированием
Старый 18.10.2025, 12:18   #49
burunduk
попробуй отними
Профессор
 
Аватар для burunduk
 
Регистрация: 14.07.2020
Сообщений: 911
Сказал(а) спасибо: 1,129
Получил(а) "Спасибо": 2,182
Нарушения: 0/0 (0)
Репутация: 757769

По умолчанию Re: И снова об ИИ

HappySoftX, обычная тупость ai,
burunduk, обрабатывал выгрузки прайсов в 1000к+ строк именно в тематике закупка автозапчастей по списку 98к позиций, задача была несколько иной найти минимум 3 поставщиков с ценами удовлетворяющими рекомендации минфина для определения закупочной цены и потратил на это всего 4 часа времени
в результате были указаны несколько сотен позиций у 3 выбранных поставщиков, цены на которые необходимо было скорректировать у поставщиков для допуска на госзакупку

ещё раз это элементарная задача
burunduk вне форума   Ответить с цитированием
Старый 18.10.2025, 18:40   #50
Васо Вчеразаши
Эксперд
Доцент
 
Аватар для Васо Вчеразаши
 
Регистрация: 28.07.2020
Сообщений: 211
Сказал(а) спасибо: 653
Получил(а) "Спасибо": 437
Нарушения: 0/0 (0)
Репутация: 464526

По умолчанию Re: И снова об ИИ

Цитата:
Сообщение от HappySoftX Посмотреть сообщение
Поиск по вхождению для запчастей не подходит
А как же оем-номера? Нахрен вообще эти вхождения? С номерами наверное только на отечественном автопроме через жопу работает.
Васо Вчеразаши вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
И снова о "Мастере и Маргарите" Irishfox Курилка 278 26.02.2025 11:29
снова я сосвоим парсингом seokotov Веб-строительство 41 11.01.2022 15:37
И снова про бриться! Had Курилка 29 23.11.2021 17:25


Текущее время: 04:55. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.11
Copyright ©2000 - 2026, vBulletin Solutions Inc. Перевод: zCarot