Создание надежных алгоритмов больших данных
Одним из ведущих алгоритмов больших данных для поиска связанных тем в неструктурированном тексте (область, называемая тематическим моделированием) является скрытое распределение Дирихле (LDA). Но когда профессор Северо-Западного университета Луис Амарал решил протестировать LDA, он обнаружил, что он не был таким точным и воспроизводимым, как должен быть ведущий алгоритм тематического моделирования. …