![]() |
|
Курилка Автомобили, хобби, спорт. И Garik77 с металлоискателем. Коммерция запрещена. |
![]() |
|
Опции темы |
![]() |
#201 | |
Senior Member
Доцент
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,926
Получил(а) "Спасибо": 2,516
Нарушения: 0/0 (0)
Репутация: 80425
|
![]() Цитата:
|
|
![]() |
![]() |
![]() |
#202 |
ОПТимизирую оптом.
Академик
Регистрация: 26.06.2020
Сообщений: 1,182
Сказал(а) спасибо: 1,474
Получил(а) "Спасибо": 3,201
Нарушения: 0/0 (0)
Репутация: 903053
|
![]()
Тут выборка уже сделана по теме казино.
По ключу на строку: Online casino Casinos online Slots Best online casino Casino Online slots Mobile casino Blackjack online Slot machine Online casino canada Online roulette Slot machines Slot games Slot sites Canada casino Casinos Play slots New casino Best online casinos New slot Slots games Slots casino Game slot Best online slot sites New slots sites Money slots Club casino Casino real money games Сам файл из которого нужно выборку сделать - 9,5 Гб. объёмом. |
![]() |
![]() |
![]() |
#203 |
Senior Member
Доцент
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,926
Получил(а) "Спасибо": 2,516
Нарушения: 0/0 (0)
Репутация: 80425
|
![]()
Я про несколько строчек из файла 9.5 гб
|
![]() |
![]() |
![]() |
#204 |
ОПТимизирую оптом.
Академик
Регистрация: 26.06.2020
Сообщений: 1,182
Сказал(а) спасибо: 1,474
Получил(а) "Спасибо": 3,201
Нарушения: 0/0 (0)
Репутация: 903053
|
![]() |
![]() |
![]() |
![]() |
#205 | |
Senior Member
Доцент
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,926
Получил(а) "Спасибо": 2,516
Нарушения: 0/0 (0)
Репутация: 80425
|
![]() Цитата:
Или тебе надо вытащить строки в которых есть вхождение любого слова из заданного списка? |
|
![]() |
![]() |
![]() |
#206 | |
ОПТимизирую оптом.
Академик
Регистрация: 26.06.2020
Сообщений: 1,182
Сказал(а) спасибо: 1,474
Получил(а) "Спасибо": 3,201
Нарушения: 0/0 (0)
Репутация: 903053
|
![]() Цитата:
Вот так с grep работает: grep slovo allkey.txt >> rez.csv; grep slovo2 allkey.txt >> rez.csv; grep -f pat.txt allkey.txt >> rez.csv В pat.txt список искомых слов. Но при 100 тыс. слов для поиска все занимает сутки. Нужно быстрее. |
|
![]() |
![]() |
![]() |
#207 |
Senior Member
Доцент
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,926
Получил(а) "Спасибо": 2,516
Нарушения: 0/0 (0)
Репутация: 80425
|
![]()
grep slovo allkey.txt >> rez.csv
поиск одного слова сколько по времени занимает? |
![]() |
![]() |
![]() |
#208 | |
ОПТимизирую оптом.
Академик
Регистрация: 26.06.2020
Сообщений: 1,182
Сказал(а) спасибо: 1,474
Получил(а) "Спасибо": 3,201
Нарушения: 0/0 (0)
Репутация: 903053
|
![]() Цитата:
И еще на уник. походу сортировал. Несколько секунд все занимало. Теперь по 100 тыс. слов надо. На уник. не нужна уже сортировка. За сутки в один поток если, 20 тыс. слов обработать может. Я в пять потоков запускаю. Собственно вопрос - стоит ли в базу загружать список и искать уже в базе. Будет ли это быстрее? |
|
![]() |
![]() |
![]() |
#209 | ||
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 905
Сказал(а) спасибо: 1,099
Получил(а) "Спасибо": 2,159
Нарушения: 0/0 (0)
Репутация: 757769
|
![]() Цитата:
сравни Цитата:
PHP код:
или Splitter.SplitTextByCharacterTransition({"0".."9"} , (c) => not List.Contains({"0".."9"}, c)) P.S. попробовал твой код, он дольше отрабатывает чем просто подсчёт цифр в строке |
||
![]() |
![]() |
![]() |
#210 | |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 905
Сказал(а) спасибо: 1,099
Получил(а) "Спасибо": 2,159
Нарушения: 0/0 (0)
Репутация: 757769
|
![]() Цитата:
если задача по выгрузке ключей постоянная то можно даже в excel реализовать, основные тормоза это загрузить всё в модель данных и при новом открытии файлов загрузка модели данных следующий тормоз это выгрузка результата на лист (и здесь будет ограничение 1млн записей) сохранение результата в файл достаточно быстро именно по причине необходимости множественной выгрузки проще сразу с бд работать |
|
![]() |
![]() |
![]() |
|
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Отзывы: литературный конкурс "Первый 2024-ый, святочный"" | valergapeev | Курилка | 113 | 02.02.2024 20:50 |
Литературный конкурс "Первый 2024-ый, святочный"" | valergapeev | Курилка | 11 | 23.01.2024 21:42 |
Мегафон, тарифы "зеленый" и "звони легко", безлимит от 60 рублей в месяц | dobroset | Биржа услуг | 16 | 19.03.2023 23:49 |
Ну и зачем сделали все подразделы "Не про работу" только для активных пользователей? | Кокетыч | О форуме | 113 | 23.07.2020 17:28 |