
Проект великих даних допомагає підприємствам отримувати цінність із складних наборів веб-даних.
Він збирає та аналізує величезні фрагменти даних, а потім передає їх у зручній для сприйняття формі.
Цей проект був зосереджений навколо збору, аналізу та стандартизації даних. Він включав обробку PDF і OCR (оптичне розпізнавання символів).
Результати проекту:
- Оброблено близько 1 мільярда записів
- Розпізнані дані 14 мовами
- Реалізовано розпізнавання індійських шрифтів із PDF
- Синхронізація офіційних даних виборців із даними Пошти Індії


Це big data проект , який займається стандартизацією, очищенням та індексуванням даних SOLR. Ми були сповнені рішучості змусити все працювати за допомогою надійного рішення для серверної обробки пошуку, укладеного у зручний інтерфейс.
Результати проекту:
- Оброблено близько 4 мільярдів записів
- Стандартизовані адреси та імена за допомогою IntEngine
- Використані вихідні бази даних: Infutor, Movers, Thrive, NCOA, Spoke
Int Framework - Потужний набір класів для швидкого створення серверних програм.
Він забезпечує:
- 100% тестована архітектура
- Процедури автоматичного журналювання
- Парадигма запит - відповідь як кореневий ключ фреймворку
- Підтримка Entity Framework із коробки
- Повна підтримка .NET 4.5, а також .NET Core
- Використовуються шаблони проектування корпоративного рівня


Int Engine - Найшвидший і найпотужніший механізм очищення даних, який базується на базах даних USPS і Census TIGER.
Він забезпечує:
- Аналіз адрес на основі даних USPS
- Геокодування на основі даних перепису TIGER
- Стандартизація адрес
- Перевірка телефонів
- Стандартизація дат