Power BI: Визуализируй данные, как будто это искусство - стр. 6
Сначала загрузите данные, а затем выполните данный запрос в редакторе Power Query. В результате получится таблица, показывающая количество повторяющихся значений, что поможет вам идентифицировать и удалить лишние записи.
Очистка данных
Очистка данных – это процесс, направленный на устранение ошибок и недочетов, которые могут повлиять на анализ. Его можно разбить на несколько этапов:
1. Удаление дубликатов: Power BI предоставляет инструмент для удаления дублей. Выделите столбцы, которые необходимо проверить на уникальность, и выберите «Удалить дубликаты» в меню.
2. Заполнение пропусков: Если в вашем наборе данных есть пропуски, вы можете заполнить их средним, медианным значением или даже значением по умолчанию. Для этого в Power Query можно использовать функцию «Заполнить вниз» для заполнения пустых ячеек предыдущими значениями.
3. Удаление лишних столбцов и строк: Часто в данных могут быть ненужные столбцы или строки. Используйте функцию «Удалить столбцы» и задайте фильтры для исключения строк с пустыми значениями.
Преобразование данных
После очистки данных следующий шаг – их преобразование. Это включает в себя изменение форматов, агрегацию, расчет производных метрик и объединение данных.
1. Изменение форматов данных: Убедитесь, что все данные имеют правильные форматы. Например, проверки на даты следует производить следующим образом: щелкните правой кнопкой мыши по столбцу с датами и выберите «Изменить тип», чтобы установить нужный формат.
2. Создание вычисляемых столбцов: Для добавления полезной информации можно создавать вычисляемые столбцы. Например, если у вас есть столбцы «Цена» и «Количество», вы можете создать новый столбец «Общая стоимость», используя формулу:
....= [Цена] * [Количество]
Для этого откройте «Модель данных», выберите «Новый столбец» и введите формулу.
3. Агрегация данных: Если вы собираетесь суммировать, усреднять или выполнять другие агрегатные функции, используйте функцию «Группировка по», чтобы работать с различными уровнями данных.
4. Соединение таблиц: Часто данные разбиты на несколько таблиц. Вы можете объединять таблицы с помощью операций объединения в Power Query. Это помогает создавать единые таблицы для анализа.
Проверка и валидация данных
После выполнения всех этапов очистки и преобразования данных важно еще раз проверить их на корректность. Например, убедитесь, что все числовые данные находятся в ожидаемом диапазоне, а даты логически последовательны. В этом поможет создание временных фильтров и сверка с исходными данными.
Итоговая визуализация
По завершении подготовки данных стоит также задуматься о том, как это повлияет на итоговые визуализации. Убедитесь, что ваши очищенные и преобразованные данные удобно легли в структуру будущих отчетов. Это означает, что вы должны заранее продумать, какие визуализации будете использовать для представления результатов, и сделать ваши данные наиболее удобными для анализа.
Правильная подготовка данных не только экономит время и усилия на этапе анализа, но и значительно повышает качество принимаемых на основе данных решений. Инструменты и вспомогательные приемы, описанные в данной главе, помогут вам уверенно справляться с этой ключевой задачей в Power BI.
Основы работы с моделями данных: взаимосвязи и структуры