Как загрузить в PostgreSQL 500 млн записей и работать с ними в R
Я заметил, что истории из моей жизни пользуются большим успехом, чем скучные новости о Linux. Поэтому рассказываю, чем я сегодня занимался.
Я заметил, что истории из моей жизни пользуются большим успехом, чем скучные новости о Linux. Поэтому рассказываю, чем я сегодня занимался.
Помните, я еще в апреле я говорил о том, что к концу лета доллар снова сильно вырастет? Как мне удалось это узнать? Я использовал прекрасный язык программирования R и пакет для финансового прогнозирования forecast. Настало время вновь заглянуть в будущее, чтобы понять: стоит ли бежать в обменник и уже поздно?
Как с помощью языка R проанализировать статистические показатели сайта на Drupal и увеличить количество посещений.
Сайт — совокупность отдельных страниц. Страница может быть популярной и привлекать посетителей, а может быть непопулярной. Если разбить страницы на кластеры и выделить признаки удачных статей, то можно будет писать больше хороших и меньше плохих. В свою очередь, это приведет к общему росту количества посещений.
Продолжаем изучение удивительного пакета для статистической обработки данных R. В прошлый раз мы рассмотрели вопросы применения функции ARIMA из пакета forecast для предсказания курса валютной пары на Forex. А сегодня рассмотрим простую, но весьма эффективную стратегию прогнозирования на основе отклонения от трендовой полиномиальной линии.
Стратегия основана на предположении, что существует «объективная» цена, которая не всегда совпадает с текущей рыночной. Текущая цена стремится к «объективной», иногда сравнивается с ней, но редко совпадает продолжительное время (иначе биржевая торговля потеряла бы смысл). Научившись примерно оценивать «объективную» цену можно понять, когда акции продаются дешевле, чем могли были бы продаваться, а когда дороже. Исходя из этого, можно делать предположения о направлении изменения цены в будущем.
R — высокоуровневый язык программирования для статистической обработки данных. С помощью R, например, можно заниматься анализом временных рядов и предсказывать биржевые котировки.
Но у R в Debian есть один существенный недостаток — пакет очень старый. Ему вот-вот исполнится три года. И всё бы ничего, но R 2.15.1 несовместим с пакетом forecast, а R без forecast — как автомобиль без руля.
Язык программирования R — настоящая жемчужина из мира Open Source. Одной из любопытных областей применения этого языка является анализ временных рядов, построение статистической модели и прогнозирование. Попробуем скрестить ужа с ежом R с MetaTrader 4, чтобы стать валютным спекулянтом и как следует нагреть руки на кризисе.