Editorial Type:
Article Category: Research Article
 | 
Online Publication Date: 01 Dec 2015

Estimating Detectability and Biological Parameters of Interest with the Use of the R Environment

Page Range: 541 – 559
DOI: 10.1670/14-075
Save
Download PDF

Abstract

Imperfect detectability in animal studies has been an acknowledged problem for several decades. A number of analytical approaches (e.g., capture–mark–recapture, distance sampling, occupancy analyses), have been developed to deal with the problem and estimate biological parameters of interest. These different analytical approaches can be implemented through various software programs, each with its own graphical user interface (GUI), data input format, and graphing capabilities. Although GUIs and mouse clicks might be convenient to conduct analyses, mouse clicks are difficult to replicate and archive in the long term. Using programming environments such as the R open source project along with a text editor yields flexibility and leaves a paper trail after the analyses are conducted. Such environments also provide statistical and graphical tools for further treatment following the analyses. In this article, I use R to conduct classical analyses to estimate demographic parameters in four case studies. The examples feature interacting with certain software such as MARK, as well as using recent R packages designed to implement specific analyses in both a frequentist and a Bayesian framework. The case studies present all the steps to conduct the analyses, including data importation, model selection, and multimodel inference, as well as the graphical presentation of results. Such an integrative approach provides a flexible alternative to using GUIs, while keeping everything in the same environment and documenting precisely how an analysis was conducted. These are the basic ideas behind reproducible research.

Résumé

On reconnaît depuis plusieurs décennies le problème de la probabilité de détection imparfaite lors de l'étude de populations animales. Afin d'aborder le problème et d'estimer les paramètres biologiques d'intérêt, plusieurs approches analytiques ont été développées, telles que les approches de capture–marquage–recapture, l'échantillonnage de la distance et les analyses d'occupation de sites. On peut appliquer ces différentes approches à l'aide de divers logiciels, chacun avec sa propre interface graphique, son format d'entrée des données et ses capacités à traiter les données. Les interfaces graphiques et les clics de souris sont pratiques, mais difficiles à archiver. Une alternative consiste à utiliser un environnement de programmation tel que le projet libre R en combinaison avec un éditeur de texte, ce qui amène flexibilité et permet de documenter une analyse pour la répliquer plus tard. De tels environnements offrent des outils statistiques et graphiques pour le traitement ultérieur des données. Dans cet article, je présente quatre études de cas afin d'illustrer l'usage de l'environnement R pour effectuer des analyses classiques permettant d'estimer les paramètres démographiques. Les exemples documentent en détail toutes les étapes de l'analyse, incluant l'importation des données, la réalisation des analyses, la sélection de modèle et l'inférence multimodèle ainsi que la présentation graphique des résultats. De plus, je présente comment appeler certains logiciels à partir de R, tel que MARK ou des logiciels bayésiens. Une telle approche intégrative s'avère une alternative intéressante à l'usage des environnements graphiques. Ainsi, toutes les étapes de l'analyse sont documentées de façon transparente dans un seul environnement de travail pour un usage ultérieur. Ce sont les idées de base derrière la recherche reproductible.

Copyright: Copyright 2015 Society for the Study of Amphibians and Reptiles 2015
archive
<sc>Fig</sc>
. 1. 
Fig . 1. 

Model-averaged estimates of detection probability of Bullfrogs (Lithobates catesbeianus) during call surveys and minnow trapping sessions in 50 wetlands of the Montréal area in 2009. Error bars denote 95% unconditional confidence intervals.


<sc>Fig</sc>
. 2. 
Fig . 2. 

Apparent survival (A) and recapture probabilities (B) of female and male Red-spotted Newts (Notophthalmus v. viridescens) from the top-ranked CMR model for the Gill (1985) data set spanning from 1975 to 1983. Error bars denote 95% profile likelihood intervals.


<sc>Fig</sc>
. 3. 
Fig . 3. 

Detection functions from distance sampling models with half-normal and hazard-rate key functions on the simulated Gopher Tortoise data. Some models included a second-order cosine adjustment (cos2).


Accepted: 15 Mar 2015
  • Download PDF