Нечеткое сопоставление данных в SQL






Вы получили два разных, но связанных между собой набора данных? Что делать? Какие инструменты использовать для поиска совпадений? А если все, что у вас есть, — это доступ к базе данных с помощью запроса SQL SELECT? Джим Лемер познакомит вас с лучшими практиками, техниками и хитрыми приемами, которые помогут импортировать, очищать, сопоставлять, оценивать и осмысливать разнородные данные с помощью SQL. Администраторы баз данных, разработчики, бизнес-аналитики и специалисты data science узнают, как выявлять и удалять дубликаты, парсить строки, извлекать данные из XML и JSON, упорядочивать данные, а также работать над качеством данных и выполнять операции ETL для поиска сходств и различий между разными представлениями одинаковых данных. Примеры в книге содержат реальные кейсы и рабочий код.
Go to description and details| Publisher | Sprint Book |
| Series | Бестселлеры O`Reilly |
| Publication year | 2024 |
| ISBN | 978-601-08-4037-9 |
| Weight, g | 512 |
Вы получили два разных, но связанных между собой набора данных? Что делать? Какие инструменты использовать для поиска совпадений? А если все, что у вас есть, — это доступ к базе данных с помощью запроса SQL SELECT? Джим Лемер познакомит вас с лучшими практиками, техниками и хитрыми приемами, которые помогут импортировать, очищать, сопоставлять, оценивать и осмысливать разнородные данные с помощью SQL. Администраторы баз данных, разработчики, бизнес-аналитики и специалисты data science узнают, к ...
| Publisher | Sprint Book |
| Series | Бестселлеры O`Reilly |
| Publication year | 2024 |
| ISBN | 978-601-08-4037-9 |
| Weight, g | 512 |