added tilde before cites
[lectures/latex.git] / posic / thesis / basics.tex
index 05c49e6..951cef9 100644 (file)
@@ -4,12 +4,12 @@
 In the following the simulation methods used within the scope of this study are introduced.
 Enabling the investigation of the evolution of structure on the atomic scale, molecular dynamics (MD) simulations are chosen for modeling the behavior and precipitation of C introduced into an initially crystalline Si environment.
 To be able to model systems with a large amount of atoms computational efficient classical potentials to describe the interaction of the atoms are most often used in MD studies.
-For reasons of flexibility in executing this non-standard task and in order to be able to use a novel interaction potential \cite{albe_sic_pot} an appropriate MD code called \textsc{posic}\footnote{\textsc{posic} is an abbreviation for {\bf p}recipitation {\bf o}f {\bf SiC}} including a library collecting respective MD subroutines was developed from scratch\footnote{Source code: http://www.physik.uni-augsburg.de/\~{}zirkelfr/posic}.
+For reasons of flexibility in executing this non-standard task and in order to be able to use a novel interaction potential~\cite{albe_sic_pot} an appropriate MD code called \textsc{posic}\footnote{\textsc{posic} is an abbreviation for {\bf p}recipitation {\bf o}f {\bf SiC}} including a library collecting respective MD subroutines was developed from scratch\footnote{Source code: http://www.physik.uni-augsburg.de/\~{}zirkelfr/posic}.
 The basic ideas of MD in general and the adopted techniques as implemented in \textsc{posic} in particular are outlined in section \ref{section:md}, while the functional form and derivative of the employed classical potential is presented in appendix \ref{app:d_tersoff}.
 An overview of the most important tools within the MD package is given in appendix \ref{app:code}.
 Although classical potentials are often most successful and at the same time computationally efficient in calculating some physical properties of a particular system, not all of its properties might be described correctly due to the lack of quantum-mechanical effects.
 Thus, in order to obtain more accurate results quantum-mechanical calculations from first principles based on density functional theory (DFT) were performed.
-The Vienna {\em ab initio} simulation package (\textsc{vasp}) \cite{kresse96} is used for this purpose.
+The Vienna {\em ab initio} simulation package (\textsc{vasp})~\cite{kresse96} is used for this purpose.
 The relevant basics of DFT are described in section \ref{section:dft} while an overview of utilities mainly used to create input or parse output data of \textsc{vasp} is given in appendix \ref{app:code}.
 The gain in accuracy achieved by this method, however, is accompanied by an increase in computational effort constraining the simulated system to be much smaller in size.
 Thus, investigations based on DFT are restricted to single defects or combinations of two defects in a rather small Si supercell, their structural relaxation as well as some selected diffusion processes.
@@ -24,7 +24,7 @@ The method used to investigate migration pathways to identify the prevalent diff
 \begin{quotation}
 \dq We may regard the present state of the universe as the effect of the past and the cause of the future. An intellect which at any given moment knew all of the forces that animate nature and the mutual positions of the beings that compose it, if this intellect were vast enough to submit the data to analysis, could condense into a single formula the movement of the greatest bodies of the universe and that of the lightest atom; for such an intellect nothing could be uncertain and the future just like the past would be present before its eyes.\dq{}
 \begin{flushright}
-{\em Marquis Pierre Simon de Laplace, 1814.} \cite{laplace}
+{\em Marquis Pierre Simon de Laplace, 1814.}~\cite{laplace}
 \end{flushright}
 \end{quotation}
 
@@ -36,7 +36,7 @@ This understanding may be regarded as the basic principle of molecular dynamics,
 \subsection{Introduction to molecular dynamics simulations}
 
 Molecular dynamics (MD) simulation is a technique to compute a system of particles, referred to as molecules, with their positions, velocities and forces among each other evolving in time.
-The MD method was first introduced by Alder and Wainwright in 1957 \cite{alder57,alder59} to study the interactions of hard spheres.
+The MD method was first introduced by Alder and Wainwright in 1957~\cite{alder57,alder59} to study the interactions of hard spheres.
 The basis of the approach are Newton's equations of motion to describe classically the many-body system.
 MD is the numerical way of solving the $N$-body problem which cannot be solved analytically for $N>3$.
 A potential is necessary to describe the interaction of the particles.
@@ -94,17 +94,17 @@ A three body potential has to be included for these types of elements.
 
 \subsubsection{The Tersoff bond order potential}
 
-Tersoff proposed an empirical interatomic potential for covalent systems \cite{tersoff_si1,tersoff_si2}.
+Tersoff proposed an empirical interatomic potential for covalent systems~\cite{tersoff_si1,tersoff_si2}.
 The Tersoff potential explicitly incorporates the dependence of bond order on local environments, permitting an improved description of covalent materials.
 Due to the covalent character Tersoff restricted the interaction to nearest neighbor atoms accompanied by an increase in computational efficiency for the evaluation of forces and energy based on the short-range potential.
-Tersoff applied the potential to silicon \cite{tersoff_si1,tersoff_si2,tersoff_si3}, carbon \cite{tersoff_c} and also to multicomponent systems like silicon carbide \cite{tersoff_m}.
-The basic idea is that, in real systems, the bond order, i.e.\ the strength of the bond, depends upon the local environment \cite{abell85}.
+Tersoff applied the potential to silicon~\cite{tersoff_si1,tersoff_si2,tersoff_si3}, carbon~\cite{tersoff_c} and also to multicomponent systems like silicon carbide~\cite{tersoff_m}.
+The basic idea is that, in real systems, the bond order, i.e.\ the strength of the bond, depends upon the local environment~\cite{abell85}.
 Atoms with many neighbors form weaker bonds than atoms with only a few neighbors.
 Although the bond strength intricately depends on geometry, the focus on coordination, i.e.\ the number of neighbors forming bonds, is well motivated qualitatively from basic chemistry since for every additional formed bond the amount of electron pairs per bond and, thus, the strength of the bonds is decreased.
 If the energy per bond decreases rapidly enough with increasing coordination the most stable structure will be the dimer.
 In the other extreme, if the dependence is weak, the material system will end up in a close-packed structure in order to maximize the number of bonds and likewise minimize the cohesive energy.
 This suggests the bond order to be a monotonously decreasing function with respect to coordination and the equilibrium coordination being determined by the balance of bond strength and number of bonds.
-Based on pseudopotential theory, the bond order term $b_{ijk}$ limiting the attractive pair interaction is of the form $b_{ijk}\propto Z^{-\delta}$ where $Z$ is the coordination number and $\delta$ a constant \cite{abell85}, which is $\frac{1}{2}$ in the second-moment approximation within the tight binding scheme \cite{horsfield96}.
+Based on pseudopotential theory, the bond order term $b_{ijk}$ limiting the attractive pair interaction is of the form $b_{ijk}\propto Z^{-\delta}$ where $Z$ is the coordination number and $\delta$ a constant~\cite{abell85}, which is $\frac{1}{2}$ in the second-moment approximation within the tight binding scheme~\cite{horsfield96}.
 
 Tersoff incorporated the concept of bond order in a three-body potential formalism.
 The interatomic potential is taken to have the form
@@ -150,7 +150,7 @@ This is illustrated in Fig.~\ref{img:tersoff_angle}.
 \end{figure}
 The angular dependence does not give a fixed minimum angle between bonds since the expression is embedded inside the bond order term.
 The relation to the above discussed bond order potential becomes obvious if $\chi=1, \beta=1, n=1, \omega=1$ and $c=0$.
-Parameters with a single subscript correspond to the parameters of the elemental system \cite{tersoff_si3,tersoff_c} while the mixed parameters are obtained by interpolation from the elemental parameters by the arithmetic or geometric mean.
+Parameters with a single subscript correspond to the parameters of the elemental system~\cite{tersoff_si3,tersoff_c} while the mixed parameters are obtained by interpolation from the elemental parameters by the arithmetic or geometric mean.
 The elemental parameters were obtained by fit with respect to the cohesive energies of real and hypothetical bulk structures and the bulk modulus and bond length of the diamond structure.
 New parameters for the mixed system are $\chi$, which is used to finetune the strength of heteropolar bonds, and $\omega$, which is set to one for the C-Si interaction but is available as a feature to permit the application of the potential to more drastically different types of atoms in the future.
 
@@ -169,12 +169,12 @@ Details of the Tersoff potential derivative are presented in appendix \ref{app:d
 
 Although the Tersoff potential is one of the most widely used potentials, there are some shortcomings.
 Describing the Si-Si interaction Tersoff was unable to find a single parameter set to describe well both, bulk and surface properties.
-Due to this and since the first approach labeled T1 \cite{tersoff_si1} turned out to be unstable \cite{dodson87}, two further parametrizations exist, T2 \cite{tersoff_si2} and T3 \cite{tersoff_si3}.
+Due to this and since the first approach labeled T1~\cite{tersoff_si1} turned out to be unstable~\cite{dodson87}, two further parametrizations exist, T2~\cite{tersoff_si2} and T3~\cite{tersoff_si3}.
 While T2 describes well surface properties, T3 yields improved elastic constants and should be used for describing bulk properties.
 However, T3, which is used in the Si/C potential, suffers from an underestimation of the dimer binding energy.
 Similar behavior is found for the C-C interaction.
 
-For this reason, Erhart and Albe provide a reparametrization of the Tersoff potential based on three independently fitted parameter sets for the Si-Si, C-C and Si-C interaction \cite{albe_sic_pot}.
+For this reason, Erhart and Albe provide a reparametrization of the Tersoff potential based on three independently fitted parameter sets for the Si-Si, C-C and Si-C interaction~\cite{albe_sic_pot}.
 The functional form is similar to the one proposed by Tersoff.
 Differences in the energy functional and the force evaluation routine are pointed out in appendix \ref{app:d_tersoff}.
 Concerning Si the elastic properties of the diamond phase as well as the structure and energetics of the dimer are reproduced very well.
@@ -182,13 +182,13 @@ The new parameter set for the C-C interaction yields improved dimer properties w
 The potential succeeds in the description of the low as well as high coordinated structures.
 The description of elastic properties of SiC is improved with respect to the potentials available in literature.
 Defect properties are only fairly reproduced but the description is comparable to previously published potentials.
-It is claimed that the potential enables modeling of widely different configurations and transitions among these and has recently been used to simulate the inert gas condensation of Si-C nanoparticles \cite{erhart04}.
+It is claimed that the potential enables modeling of widely different configurations and transitions among these and has recently been used to simulate the inert gas condensation of Si-C nanoparticles~\cite{erhart04}.
 Therefore, the Erhart/Albe (EA) potential is considered the superior analytical bond order potential to study the SiC precipitation and associated processes in Si.
 
 \subsection{Verlet integration}
 \label{subsection:integrate_algo}
 
-A numerical method to integrate Newton's equations of motion was presented by Verlet in 1967 \cite{verlet67}.
+A numerical method to integrate Newton's equations of motion was presented by Verlet in 1967~\cite{verlet67}.
 The idea of the so-called Verlet and a variant, the velocity Verlet algorithm, which additionally generates directly the velocities, is explained in the following.
 Starting point is the Taylor series for the particle positions at time $t+\delta t$ and $t-\delta t$
 \begin{equation}
@@ -281,7 +281,7 @@ It provides a stable algorithm that allows smooth changes of the system to new v
 \section{Density functional theory}
 \label{section:dft}
 
-Dirac declared that chemistry has come to an end, its content being entirely contained in the powerful equation published by Schr\"odinger in 1926 \cite{schroedinger26} marking the beginning of wave mechanics.
+Dirac declared that chemistry has come to an end, its content being entirely contained in the powerful equation published by Schr\"odinger in 1926~\cite{schroedinger26} marking the beginning of wave mechanics.
 Following the path of Schr\"odinger, the problem in quantum-mechanical modeling of describing the many-body problem, i.e.\ a system of a large amount of interacting particles, is manifested in the high-dimensional Schr\"odinger equation for the wave function $\Psi({\vec{R}},{\vec{r}})$ that depends on the coordinates of all nuclei and electrons.
 The Schr\"odinger equation contains the kinetic energy of the ions and electrons as well as the electron-ion, ion-ion and electron-electron interaction.
 This cannot be solved exactly and finding approximate solutions requires several layers of simplification in order to reduce the number of free parameters.
@@ -289,12 +289,12 @@ Approximations that consider a truncated Hilbert space of single-particle orbita
 
 In contrast, instead of using the description by the many-body wave function, the key point in density functional theory (DFT) is to recast the problem to a description utilizing the charge density $n(\vec{r})$, which constitutes a quantity in real space depending only on the three spatial coordinates.
 In the following sections the basic idea of DFT will be outlined.
-As will be shown, DFT can formally be regarded as an exactification of the Thomas Fermi theory \cite{thomas27,fermi27} and the self-consistent Hartree equations \cite{hartree28}.
-A nice review is given in the Nobel lecture of Kohn \cite{kohn99}, one of the inventors of DFT.
+As will be shown, DFT can formally be regarded as an exactification of the Thomas Fermi theory~\cite{thomas27,fermi27} and the self-consistent Hartree equations~\cite{hartree28}.
+A nice review is given in the Nobel lecture of Kohn~\cite{kohn99}, one of the inventors of DFT.
 
 \subsection{Born-Oppenheimer approximation}
 
-Born and Oppenheimer proposed a simplification enabling the effective decoupling of the electronic and ionic degrees of freedom \cite{born27}.
+Born and Oppenheimer proposed a simplification enabling the effective decoupling of the electronic and ionic degrees of freedom~\cite{born27}.
 Within the Born-Oppenheimer (BO) approximation the light electrons are assumed to move much faster and, thus, follow adiabatically to the motion of the heavy nuclei, if the latter are only slightly deflected from their equilibrium positions.
 Thus, on the timescale of electronic motion the ions appear at fixed positions.
 On the other way round, on the timescale of nuclear motion the electrons appear blurred in space adding an extra term to the ion-ion potential.
@@ -320,13 +320,13 @@ This raised the question how to establish a connection between TF expressed in t
 The answer to this question, whether the charge density completely characterizes a system, became the starting point of modern DFT.
 
 Considering a system with a nondegenerate ground state there is obviously only one ground-state charge density $n_0(\vec{r})$ that corresponds to a given potential $V(\vec{r})$.
-In 1964 Hohenberg and Kohn showed the opposite and far less obvious result \cite{hohenberg64}.
+In 1964 Hohenberg and Kohn showed the opposite and far less obvious result~\cite{hohenberg64}.
 Employing no more than the Rayleigh-Ritz minimal principle it is concluded by {\em reductio ad absurdum} that for a nondegenerate ground state the same charge density cannot be generated by different potentials.
 Thus, the charge density of the ground state $n_0(\vec{r})$ uniquely determines the potential $V(\vec{r})$ and, consequently, the full Hamiltonian and ground-state energy $E_0$.
 In mathematical terms the full many-electron ground state is a unique functional of the charge density.
 In particular, $E$ is a functional $E[n(\vec{r})]$ of $n(\vec{r})$.
 
-The ground-state charge density $n_0(\vec{r})$ minimizes the energy functional $E[n(\vec{r})]$, its value corresponding to the ground-state energy $E_0$, which enables the formulation of a minimal principle in terms of the charge density \cite{hohenberg64,levy82}
+The ground-state charge density $n_0(\vec{r})$ minimizes the energy functional $E[n(\vec{r})]$, its value corresponding to the ground-state energy $E_0$, which enables the formulation of a minimal principle in terms of the charge density~\cite{hohenberg64,levy82}
 \begin{equation}
 E_0=\min_{n(\vec{r})}
  \left\{
@@ -351,7 +351,7 @@ U=\frac{1}{2}\int\frac{n(\vec{r})n(\vec{r}')}{|\vec{r}-\vec{r}'|}d\vec{r}d\vec{r
 
 \subsection{Kohn-Sham system}
 
-Inspired by the Hartree equations, i.e.\ a set of self-consistent single-particle equations for the approximate solution of the many-electron problem \cite{hartree28}, which describe atomic ground states much better than the TF theory, Kohn and Sham presented a Hartree-like formulation of the Hohenberg and Kohn minimal principle \eqref{eq:basics:hkm} \cite{kohn65}.
+Inspired by the Hartree equations, i.e.\ a set of self-consistent single-particle equations for the approximate solution of the many-electron problem~\cite{hartree28}, which describe atomic ground states much better than the TF theory, Kohn and Sham presented a Hartree-like formulation of the Hohenberg and Kohn minimal principle \eqref{eq:basics:hkm}~\cite{kohn65}.
 However, due to a more general approach, the new formulation is formally exact by introducing the energy functional $E_{\text{xc}}[n(\vec{r})]$, which accounts for the exchange and correlation energy of the electron interaction $U$ and possible corrections due to electron interaction to the kinetic energy $T$.
 The respective Kohn-Sham equations for the effective single-particle wave functions $\Phi_i(\vec{r})$ take the form
 \begin{equation}
@@ -400,7 +400,7 @@ Clearly, this directs attention to the functional, which now contains the costs
 As discussed above, the HK and KS formulations are exact and so far no approximations except the adiabatic approximation entered the theory.
 However, to make concrete use of the theory, effective approximations for the exchange and correlation energy functional $E_{\text{xc}}[n(\vec{r})]$ are required.
 
-Most simple and at the same time remarkably useful is the approximation of $E_{\text{xc}}[n(\vec{r})]$ by a function of the local density \cite{kohn65}
+Most simple and at the same time remarkably useful is the approximation of $E_{\text{xc}}[n(\vec{r})]$ by a function of the local density~\cite{kohn65}
 \begin{equation}
 E^{\text{LDA}}_{\text{xc}}[n(\vec{r})]=\int\epsilon_{\text{xc}}(n(\vec{r}))n(\vec{r}) d\vec{r}
 \text{ ,}
@@ -408,14 +408,14 @@ E^{\text{LDA}}_{\text{xc}}[n(\vec{r})]=\int\epsilon_{\text{xc}}(n(\vec{r}))n(\ve
 \end{equation}
 which is, thus, called local density approximation (LDA).
 Here, the exchange-correlation energy per particle of the uniform electron gas of constant density $n$ is used for $\epsilon_{\text{xc}}(n(\vec{r}))$.
-Although, even in such a simple case, no exact form of the correlation part of $\epsilon_{\text{xc}}(n)$ is known, highly accurate numerical estimates using Monte Carlo methods \cite{ceperley80} and corresponding parametrizations exist \cite{perdew81}.
+Although, even in such a simple case, no exact form of the correlation part of $\epsilon_{\text{xc}}(n)$ is known, highly accurate numerical estimates using Monte Carlo methods~\cite{ceperley80} and corresponding parametrizations exist~\cite{perdew81}.
 Obviously exact for the homogeneous electron gas, the LDA was {\em a priori} expected to be useful only for densities varying slowly on scales of the local Fermi or TF wavelength.
 Nevertheless, LDA turned out to be extremely successful in describing some properties of highly inhomogeneous systems accurately within a few percent.
 Although LDA is known to overestimate the cohesive energy in solids by \unit[10--20]{\%}, the lattice parameters are typically determined with an astonishing accuracy of about \unit[1]{\%}.
 
-More accurate approximations of the exchange-correlation functional are realized by the introduction of gradient corrections with respect to the density \cite{kohn65}.
+More accurate approximations of the exchange-correlation functional are realized by the introduction of gradient corrections with respect to the density~\cite{kohn65}.
 Respective considerations are based on the concept of an exchange-correlation hole density describing the depletion of the electron density in the vicinity of an electron.
-The averaged hole density can be used to give a formally exact expression for $E_{\text{xc}}[n(\vec{r})]$ and an equivalent expression \cite{kohn96,kohn98}, which makes use of the electron density distribution $n(\tilde{\vec{r}})$ at positions $\tilde{\vec{r}}$ near $\vec{r}$, yielding the form
+The averaged hole density can be used to give a formally exact expression for $E_{\text{xc}}[n(\vec{r})]$ and an equivalent expression~\cite{kohn96,kohn98}, which makes use of the electron density distribution $n(\tilde{\vec{r}})$ at positions $\tilde{\vec{r}}$ near $\vec{r}$, yielding the form
 \begin{equation}
 E_{\text{xc}}[n(\vec{r})]=\int\epsilon_{\text{xc}}(\vec{r};[n(\tilde{\vec{r}})])n(\vec{r}) d\vec{r}
 \end{equation}
@@ -446,7 +446,7 @@ However, these methods rely on the fact that the wave functions are localized an
 
 Another approach is to represent the KS wave functions by plane waves.
 In fact, the employed \textsc{vasp} software is solving the KS equations within a plane-wave (PW) basis set.
-The idea is based on the Bloch theorem \cite{bloch29}, which states that in a periodic crystal each electronic wave function $\Phi_i(\vec{r})$ can be written as the product of a wave-like envelope function $\exp(i\vec{kr})$ and a function that has the same periodicity as the lattice.
+The idea is based on the Bloch theorem~\cite{bloch29}, which states that in a periodic crystal each electronic wave function $\Phi_i(\vec{r})$ can be written as the product of a wave-like envelope function $\exp(i\vec{kr})$ and a function that has the same periodicity as the lattice.
 The latter one can be expressed by a Fourier series, i.e.\ a discrete set of plane waves whose wave vectors just correspond to reciprocal lattice vectors $\vec{G}$ of the crystal.
 Thus, the one-electron wave function $\Phi_i(\vec{r})$ associated with the wave vector $\vec{k}$ can be expanded in terms of a discrete PW basis set
 \begin{equation}
@@ -504,7 +504,7 @@ As discussed in the last part of the previous section, an extremely large basis
 It is worth to stress out one more time, that this is mainly due to the orthogonalization wiggles of the wave functions of valence electrons near the nuclei.
 Thus, existing core states practically prevent the use of a PW basis set.
 However, the core electrons, which are tightly bound to the nuclei, do not contribute significantly to chemical bonding or other physical properties of the solid.
-This fact is exploited in the pseudopotential (PP) approach \cite{cohen70} by removing the core electrons and replacing the atom and the associated strong ionic potential by a pseudoatom and a weaker PP that acts on a set of pseudo wave functions rather than the true valance wave functions.
+This fact is exploited in the pseudopotential (PP) approach~\cite{cohen70} by removing the core electrons and replacing the atom and the associated strong ionic potential by a pseudoatom and a weaker PP that acts on a set of pseudo wave functions rather than the true valance wave functions.
 This way, the pseudo wave functions become smooth near the nuclei.
 
 Most PPs satisfy four general conditions.
@@ -512,13 +512,13 @@ The pseudo wave functions generated by the PP should not contain nodes, i.e.\ th
 Outside the core region, the pseudo and real valence wave functions as well as the generated charge densities need to be identical.
 The charge enclosed within the core region must be equal for both wave functions.
 Last, almost redundantly, the valence all-electron and pseudopotential eigenvalues must be equal.
-Pseudopotentials that meet the conditions outlined above are referred to as norm-conserving pseudopotentials \cite{hamann79}.
+Pseudopotentials that meet the conditions outlined above are referred to as norm-conserving pseudopotentials~\cite{hamann79}.
 
 %Certain properties need to be fulfilled by PPs and the resulting pseudo wave functions.
 %The pseudo wave functions should yield the same energy eigenvalues than the true valence wave functions.
 %The PP is called norm-conserving if the pseudo and real charge contained within the core region matches.
 %To guarantee transferability of the PP the logarithmic derivatives of the real and pseudo wave functions and their first energy derivatives need to agree outside of the core region.
-%A simple procedure was proposed to extract norm-conserving PPs obyeing the above-mentioned conditions from {\em ab initio} atomic calculations \cite{hamann79}.
+%A simple procedure was proposed to extract norm-conserving PPs obyeing the above-mentioned conditions from {\em ab initio} atomic calculations~\cite{hamann79}.
 
 In order to achieve these properties different PPs are required for the different shapes of the orbitals, which are determined by their angular momentum.
 Mathematically, a non-local PP, which depends on the angular momentum, has the form
@@ -528,7 +528,7 @@ V_{\text{nl}}(\vec{r}) = \sum_{lm} | lm \rangle V_l(\vec{r}) \langle lm |
 \end{equation}
 Applying the operator $V_{\text{nl}}(\vec{r})$ decomposes the electronic wave functions into spherical harmonics $| lm \rangle$, i.e.\ the orbitals with azimuthal angular momentum $l$ and magnetic number $m$, which are then multiplied by the respective pseudopotential $V_l(\vec{r})$ for angular momentum $l$.
 The standard generation procedure of pseudopotentials proceeds by varying its parameters until the pseudo eigenvalues are equal to the all-electron valence eigenvalues and the pseudo wave functions match the all-electron valence wave functions beyond a certain cut-off radius determining the core region.
-Modified methods to generate ultra-soft pseudopotentials were proposed, which address the rapid convergence with respect to the size of the plane wave basis set \cite{vanderbilt90,troullier91}.
+Modified methods to generate ultra-soft pseudopotentials were proposed, which address the rapid convergence with respect to the size of the plane wave basis set~\cite{vanderbilt90,troullier91}.
 
 Using PPs the rapid oscillations of the wave functions near the core of the atoms are removed considerably reducing the number of plane waves necessary to appropriately expand the wave functions.
 More importantly, less accuracy is required compared to all-electron calculations to determine energy differences among ionic configurations, which almost totally appear in the energy of the valence electrons that are typically a factor $10^3$ smaller than the energy of the core electrons.
@@ -539,7 +539,7 @@ More importantly, less accuracy is required compared to all-electron calculation
 Following Bloch's theorem only a finite number of electronic wave functions need to be calculated for a periodic system.
 However, to calculate quantities like the total energy or charge density, these have to be evaluated in a sum over an infinite number of $\vec{k}$ points.
 Since the values of the wave function within a small interval around $\vec{k}$ are almost identical, it is possible to approximate the infinite sum by a sum over an affordable number of $k$ points, each representing the respective region of the wave function in $\vec{k}$ space. 
-Methods have been derived for obtaining very accurate approximations by a summation over special sets of $\vec{k}$ points with distinct, associated weights \cite{baldereschi73,chadi73,monkhorst76}.
+Methods have been derived for obtaining very accurate approximations by a summation over special sets of $\vec{k}$ points with distinct, associated weights~\cite{baldereschi73,chadi73,monkhorst76}.
 If present, symmetries in reciprocal space may further reduce the number of calculations.
 For supercells, i.e.\ repeating unit cells that contain several primitive cells, restricting the sampling of the Brillouin zone (BZ) to the $\Gamma$ point can yield quite accurate results.
 In fact, with respect to BZ sampling, calculating wave functions of a supercell containing $n$ primitive cells for only one $\vec{k}$ point is equivalent to the scenario of a single primitive cell and the summation over $n$ points in $\vec{k}$ space.
@@ -569,7 +569,7 @@ However, provided that the $\Phi_j$ are eigenstates of $H$, it is easy to show t
 \vec{F}_i=-\sum_j \langle \Phi_j | \Phi_j\frac{\partial V}{\partial \vec{R}_i} \rangle
 \text{ .}
 \end{equation}
-This is called the Hellmann-Feynman theorem \cite{feynman39}, which enables the calculation of forces, called the Hellmann-Feynman forces, acting on the nuclei for a given configuration, without the need for evaluating computationally costly energy maps.
+This is called the Hellmann-Feynman theorem~\cite{feynman39}, which enables the calculation of forces, called the Hellmann-Feynman forces, acting on the nuclei for a given configuration, without the need for evaluating computationally costly energy maps.
 
 \section{Modeling of point defects}
 \label{section:basics:defects}
@@ -656,7 +656,7 @@ The path exhibiting the minimal energy difference determines the diffusion path
 \caption{Schematic of the constrained relaxation technique (a) and of a modified version (b) used to obtain migration pathways and corresponding configurational energies.}
 \label{fig:basics:crt}
 \end{figure}
-One possibility to compute the migration path from one stable configuration into another one is provided by the constrained relaxation technique (CRT) \cite{kaukonen98}.
+One possibility to compute the migration path from one stable configuration into another one is provided by the constrained relaxation technique (CRT)~\cite{kaukonen98}.
 The atoms involving great structural changes in the diffusion process are moved stepwise from the starting to the final position and relaxation after each step is only allowed in the plane perpendicular to the direction of the vector connecting its starting and final position.
 This is illustrated in Fig.~\ref{fig:basics:crto}.
 The number of steps required for smooth transitions depends on the shape of the potential energy surface.