changes to basics chapter
[lectures/latex.git] / posic / thesis / basics.tex
index 2f1bf6b..ba62d82 100644 (file)
@@ -1,60 +1,80 @@
-\chapter{Basics}
+\chapter{Basic principles of utilized simulation techniques}
+\label{chapter:basics}
+
+In the following the simulation methods used within the scope of this study are introduced.
+Enabling the investigation of the evolution of structure on the atomic scale, molecular dynamics (MD) simulations are chosen for modeling the behavior and precipitation of C introduced into an initially crystalline Si environment.
+To be able to model systems with a large amount of atoms computational efficient classical potentials to describe the interaction of the atoms are most often used in MD studies.
+For reasons of flexibility in executing this non-standard task and in order to be able to use a novel interaction potential \cite{albe_sic_pot} an appropriate MD code called {\textsc posic}\footnote{{\textsc posic} is an abbreviation for {\bf p}recipitation {\bf o}f {\bf SiC}} including a library collecting respective MD subroutines was developed from scratch\footnote{Source code: http://www.physik.uni-augsburg.de/\~{}zirkelfr/posic}.
+The basic ideas of MD in general and the adopted techniques as implemented in {\textsc posic} in particular are outlined in section \ref{section:md}, while the functional form and derivative of the employed classical potential is presented in appendix \ref{app:d_tersoff}.
+An overview of the most important tools within the MD package is given in appendix \ref{app:code}.
+Although classical potentials are often most successful and at the same time computationally efficient in calculating some physical properties of a particular system, not all of its properties might be described correctly due to the lack of quantum-mechanical effects.
+Thus, in order to obtain more accurate results quantum-mechanical calculations from first principles based on density functional theory (DFT) were performed.
+The Vienna {\em ab initio} simulation package ({\textsc vasp}) \cite{kresse96} is used for this purpose.
+The relevant basics of DFT are described in section \ref{section:dft} while an overview of utilities mainly used to create input or parse output data of {\textsc vasp} is given in appendix \ref{app:code}.
+The gain in accuracy achieved by this method, however, is accompanied by an increase in computational effort constraining the simulated system to be much smaller in size.
+Thus, investigations based on DFT are restricted to single defects or combinations of two defects in a rather small Si supercell, their structural relaxation as well as some selected diffusion processes.
+Next to the structure, defects can be characterized by the defect formation energy, a scalar indicating the costs necessary for the formation of the defect, which is explained in section \ref{section:basics:defects}.
+The method used to investigate migration pathways to identify the prevalent diffusion mechanism is introduced in section \ref{section:basics:migration} and modifications to the {\textsc vasp} code implementing this method are presented in appendix \ref{app:patch_vasp}.
+
+\section{Molecular dynamics simulations}
+\label{section:md}
+
+% todo - rewrite md intro chapter
 
 \begin{quotation}
 \dq We may regard the present state of the universe as the effect of the past and the cause of the future. An intellect which at any given moment knew all of the forces that animate nature and the mutual positions of the beings that compose it, if this intellect were vast enough to submit the data to analysis, could condense into a single formula the movement of the greatest bodies of the universe and that of the lightest atom; for such an intellect nothing could be uncertain and the future just like the past would be present before its eyes.\dq{}
-\cite{laplace}
 \begin{flushright}
-{\em Marquis Pierre Simon de Laplace, 1814.}
+{\em Marquis Pierre Simon de Laplace, 1814.} \cite{laplace}
 \end{flushright}
 \end{quotation}
 
-\section{Molecular dynamics simulations}
-
+\noindent
 Pierre Simon de Laplace phrased this vision in terms of a controlling, omniscient instance - the {\em Laplace demon} - which would be able to look into the future as well as into the past due to the deterministic nature of processes, governed by the solution of differential equations.
 Although Laplace's vision is nowadays corrected by chaos theory and quantum mechanics, it expresses two main features of classical mechanics, the determinism of processes and time reversibility of the fundamental equations.
-This understanding was one of the first ideas for doing molecular dynamics simulations, considering an isolated system of particles, the behaviour of which is fully determined by the solution of the classical equations of motion.
+This understanding may be regarded as the basic principle of molecular dynamics, considering an isolated system of particles, the behaviour of which is fully determined by the solution of the classical equations of motion.
 
 \subsection{Introduction to molecular dynamics simulations}
 
-Basically, molecular dynamics (MD) simulation is a technique to compute a system of particles, referred to as molecules, with their positions, volocities and forces among each other evolving in time.
-The MD method was first introduced by Alder and Wainwright in 1957 \cite{alder1,alder2} to study the interactions of hard spheres.
+Molecular dynamics (MD) simulation is a technique to compute a system of particles, referred to as molecules, with their positions, volocities and forces among each other evolving in time.
+The MD method was first introduced by Alder and Wainwright in 1957 \cite{alder57,alder59} to study the interactions of hard spheres.
 The basis of the approach are Newton's equations of motion to describe classicaly the many-body system.
-MD simulation is the numerical way of solving the $N$-body problem which cannot be solved analytically ($N>3$).
-Quantum mechanical effects are taken into account by an analytical interaction potential between the nuclei.
+MD is the numerical way of solving the $N$-body problem which cannot be solved analytically for $N>3$.
+A potential is necessary to describe the interaction of the particles.
+By MD, a complete description of the system in the sense of classical mechanics on the microscopic level is obtained.
+The microscopic information can then be translated to macroscopic observables by means of statistical mechanics.
 
-By MD simulation techniques a complete description of the system in the sense of classical mechanics on the microscopic level is obtained.
-This microscopic information has to be translated to macroscopic observables by means of statistical mechanics.
-
-The basic idea is to integrate Newton's equations numerically.
+The basic idea is to assume that the particles can be described classically by Newton's equations of motion, which are integrated numerically.
 A system of $N$ particles of masses $m_i$ ($i=1,\ldots,N$) at positions ${\bf r}_i$ and velocities $\dot{{\bf r}}_i$ is given by
 \begin{equation}
-m_i \frac{d^2}{dt^2} {\bf r}_i = {\bf F}_i \, \textrm{.}
+%m_i \frac{d^2}{dt^2} {\bf r}_i = {\bf F}_i \Leftrightarrow
+%m_i \frac{d}{dt} {\bf r}_i = {\bf p}_i\textrm{ , } \quad
+%\frac{d}{dt} {\bf p}_i = {\bf F}_i\textrm{ .}
+m_i \ddot{\bf r}_i = {\bf F}_i \Leftrightarrow
+m_i \dot{\bf r}_i = {\bf p}_i\textrm{, }
+\dot{\bf p}_i = {\bf F}_i\textrm{ .}
+\label{eq:basics:newton}
 \end{equation}
 The forces ${\bf F}_i$ are obtained from the potential energy $U(\{{\bf r}\})$:
 \begin{equation}
 {\bf F}_i = - \nabla_{{\bf r}_i} U({\{\bf r}\}) \, \textrm{.}
+\label{eq:basics:force}
 \end{equation}
-
-Given the initial conditions ${\bf r}_i(t_0)$ and $\dot{{\bf r}}_i(t_0)$ the equations can be integrated by a certain integration algorithm.
+Given the initial conditions ${\bf r}_i(t_0)$ and $\dot{\bf r}_i(t_0)$, the equations can be integrated by a certain integration algorithm.
 The solution of these equations provides the complete information of a system evolving in time.
-
-The following chapters cover the tools of the trade necessary for the MD simulation technique.
-Three ingredients are required for an MD simulation:
+The following sections cover the tools of the trade necessary for the MD simulation technique.
+Three ingredients are required for a MD simulation:
 \begin{enumerate}
 \item A model for the interaction between system constituents is needed.
-      Interaction potentials and their accuracy for describing certain systems of elements will be outlined in chapter \ref{subsection:interact_pot}.
+      Interaction potentials and their accuracy for describing certain systems of elements will be outlined in section \ref{subsection:interact_pot}.
 \item An integrator is needed, which propagtes the particle positions and velocities from time $t$ to $t+\delta t$, realised by a finite difference scheme which moves trajectories discretely in time.
-      In chapter \ref{subsection:integrate_algo} a detailed overview of the available integration algorithms is given, including their advantages and disadvantages.
+      This is explained in section \ref{subsection:integrate_algo}.
 \item A statistical ensemble has to be chosen, which allows certain thermodynamic quantities to be controlled or to stay constant.
-      This is discussed in chapter \ref{subsection:statistical_ensembles}
+      This is discussed in section \ref{subsection:statistical_ensembles}.
 \end{enumerate}
+These ingredients will be outlined in the follwoing.
+The discussion is restricted to methods employed within this study.
 
-In addition special techniques will be outlined which reduce the complexity of the MD algorithm, though the force/energy evaluation almost inevitably dictates the overall speed.
-
-\subsection{Integration algorithms}
-\label{subsection:integrate_algo}
-
-\subsection{Interaction potentials}
+\subsection{Interaction potentials for silicon and carbon}
 \label{subsection:interact_pot}
 
 The potential energy of $N$ interacting atoms can be written in the form
@@ -66,81 +86,27 @@ $U_1$ is a single particle potential describing external forces.
 Examples of single particle potentials are the gravitational force or an electric field.
 $U_2$ is a two body pair potential which only depends on the distance $r_{ij}$ between the two atoms $i$ and $j$.
 If not only pair potentials are considered, three body potentials $U_3$ or multi body potentials $U_n$ can be included.
-Mainly these higher order terms are avoided since they are not easy to model and it is rather time consuming to evaluate potentials and forces originating from these many body terms.
-
+Usually these higher order terms are avoided since they are not easy to model and it is rather time consuming to evaluate potentials and forces originating from these many body terms.
 Ordinary pair potentials have a close-packed structure like face-centered cubic (FCC) or hexagonal close-packed (HCP) as a ground state.
-A pair potential is thus unable to describe properly elements with other structures than FCC or HCP.
-Silicon and carbon for instance, have a diamand/zincblende structure with four covalent bonded neighbours, which is far from a close-packed structure.
+A pair potential is, thus, unable to describe properly elements with other structures than FCC or HCP.
+Silicon and carbon for instance, have a diamand and zincblende structure with four covalently bonded neighbors, which is far from a close-packed structure.
 A three body potential has to be included for these types of elements.
 
-In the following, relevant potentials for this work are discussed. 
-
-\subsubsection{The Lennard-Jones potential}
-
-The L-J potential is a realistic two body pair potential and is of the form
-\begin{equation}
-U^{LJ}(r) = 4 \epsilon \Big[ \Big( \frac{\sigma}{r} \Big)^{12} - \Big( \frac{\sigma}{r} \Big)^6 \Big] \, \textrm{,}
-\label{eq:lj-p}
-\end{equation}
-where $r$ denotes the distance between the two atoms.
-
-The attractive tail for large separations $(\sim r^{-6})$ is essentially due to correlations between electron clouds surrounding the atoms. The attractive part is also known as {\em van der Waals} or {\em London} interaction.
-It can be derived classically by considering how two charged spheres induce dipol-dipol interactions into each other, or by considering the interaction between two oscillators in a quantum mechanical way.
-
-The repulsive term $(\sim r^{-12})$ captures the non-bonded overlap of the electron clouds.
-It does not have a true physical motivation, other than the exponent being larger than $6$ to get a steep rising repulsive potential wall at short distances.
-Chosing $12$ as the exponent of the repulsive term it is just the square of the attractive term which makes the potential evaluable in a very efficient way.
-
-The constants $\epsilon$ and $\sigma$ are usually determined by fitting to experimental data.
-$\epsilon$ accounts to the depth of the potential well, where $\sigma$ is regarded as the radius of the particle, also known as the van der Waals radius.
-
-Writing down the derivation of the Lennard-Jones potential in respect to $x_i$ (the $i$th component of the distance vector ${\bf r}$)
-\begin{equation}
-\frac{\partial}{\partial x_i} U^{LJ}(r) = 4 \epsilon x_i \Big( -12 \frac{\sigma^{12}}{r^{14}} + 6 \frac{\sigma^6}{r^8} \Big)
-\label{eq:lj-d}
-\end{equation}
-one can easily identify $\sigma$ by the equilibrium distance of the atoms $r_e=\sqrt[6]{2} \sigma$.
-Applying the equilibrium distance into \eqref{eq:lj-p} $\epsilon$ turns out to be the negative well depth.
-The $i$th component of the force $F^j$ on particle $j$ is obtained by
-\begin{equation}
-F_i^j = - \frac{\partial}{\partial x_i} U^{LJ}(r) \, \textrm{.}
-\label{eq:lj-f}
-\end{equation}
-
-\subsubsection{The Stillinger Weber potential}
-
-The Stillinger Weber potential \cite{stillinger_weber} \ldots
-
-\begin{equation}
-U = \sum_{i,j} U_2({\bf r}_i,{\bf r}_j) + \sum_{i,j,k} U_3({\bf r}_i,{\bf r}_j,{\bf r}_k)
-\end{equation}
-
-\begin{equation}
-U_2(r_{ij}) = \left\{
-  \begin{array}{ll}
-    \epsilon A \Big( B (r_{ij} / \sigma)^{-p} - 1\Big) \exp \Big[ (r_{ij} / \sigma - 1)^{-1}  \Big]  & r_{ij} < a \sigma \\
-    0 & r_{ij} \ge a \sigma
-  \end{array} \right.
-\end{equation}
-
-\begin{equation}
-U_3({\bf r}_i,{\bf r}_j,{\bf r}_k) = 
-\epsilon \Big[ h(r_{ij},r_{ik},\theta_{jik}) + h(r_{ji},r_{jk},\theta_{ijk}) + h(r_{ki},r_{kj},\theta_{ikj}) \Big]
-\end{equation}
-
-\begin{equation}
-h(r_{ij},r_{ik},\theta_{jik}) =
-\lambda \exp \Big[ \gamma (r_{ij}/\sigma -a)^{-1} + \gamma (r_{ik}/\sigma - a)^{-1} \Big] \Big( \cos \theta_{jik} + \frac{1}{3} \Big)^2
-\end{equation}
-
-\subsubsection{The Tersoff potential}
-
-Tersoff proposed an empirical interatomic potential for covalent systems.
-The Tersoff potential explicitly incorporates the dependence of bond order on local envirenments, permitting an improved description of covalent materials.
-Tersoff applied the potential to silicon \cite{tersoff_silicon1,tersoff_silicon2,tersoff_silicon3}, carbon \cite{tersoff_carbon} and also to multicomponent systems like $SiC$ \cite{tersoff_multi}.
-The basic idea is that, in real systems, the bond order depends upon the local environment.
-An atom with many neighbours forms weaker bonds than an atom with few neighbours.
-
+\subsubsection{The Tersoff bond order potential}
+
+Tersoff proposed an empirical interatomic potential for covalent systems \cite{tersoff_si1,tersoff_si2}.
+The Tersoff potential explicitly incorporates the dependence of bond order on local environments, permitting an improved description of covalent materials.
+Due to the covalent character Tersoff restricted the interaction to nearest neighbor atoms accompanied by an increases in computational efficiency for the evaluation of forces and energy based on the short-range potential.
+Tersoff applied the potential to silicon \cite{tersoff_si1,tersoff_si2,tersoff_si3}, carbon \cite{tersoff_c} and also to multicomponent systems like silicon carbide \cite{tersoff_m}.
+The basic idea is that, in real systems, the bond order, i.e. the strength of the bond, depends upon the local environment \cite{abell85}.
+Atoms with many neighbors form weaker bonds than atoms with only a few neighbors.
+Although the bond strength intricately depends on geometry the focus on coordination, i.e. the number of neighbors forming bonds, is well motivated qualitatively from basic chemistry since for every additional formed bond the amount of electron pairs per bond and, thus, the strength of the bonds is decreased.
+If the energy per bond decreases rapidly enough with increasing coordination the most stable structure will be the dimer.
+In the other extreme, if the dependence is weak, the material system will end up in a close-packed structure in order to maximize the number of bonds and likewise minimize the cohesive energy.
+This suggests the bond order to be a monotonously decreasing function with respect to coordination and the equilibrium coordination being determined by the balance of bond strength and number of bonds.
+Based on pseudopotential theory the bond order term $b_{ijk}$ limitting the attractive pair interaction is of the form $b_{ijk}\propto Z^{-\delta}$ where $Z$ is the coordination number and $\delta$ a constant \cite{abell85}, which is $\frac{1}{2}$ in the seond-moment approximation within the tight binding scheme \cite{horsfield96}.
+
+Tersoff incorporated the concept of bond order in a three-body potential formalism.
 The interatomic potential is taken to have the form
 \begin{eqnarray}
 E & = & \sum_i E_i = \frac{1}{2} \sum_{i \ne j} V_{ij} \textrm{ ,} \\
@@ -148,7 +114,6 @@ V_{ij} & = & f_C(r_{ij}) [ f_R(r_{ij}) + b_{ij} f_A(r_{ij}) ] \textrm{ .}
 \end{eqnarray}
 $E$ is the total energy of the system, constituted either by the sum over the site energies $E_i$ or by the bond energies $V_{ij}$.
 The indices $i$ and $j$ correspond to the atoms of the system with $r_{ij}$ being the distance from atom $i$ to atom $j$.
-
 The functions $f_R$ and $f_A$ represent a repulsive and an attractive pair potential.
 The repulsive part is due to the orthogonalization energy of overlapped atomic wave functions.
 The attractive part is associated with the bonding.
@@ -156,7 +121,7 @@ The attractive part is associated with the bonding.
 f_R(r_{ij}) & = & A_{ij} \exp (- \lambda_{ij} r_{ij} ) \\
 f_A(r_{ij}) & = & -B_{ij} \exp (- \mu_{ij} r_{ij} )
 \end{eqnarray}
-The function $f_C$ is the potential cutoff function to limit the range of the potential.
+The function $f_C$ is a cutoff function to limit the range of interaction to nearest neighbors.
 It is designed to have a smooth transition of the potential at distances $R_{ij}$ and $S_{ij}$.
 \begin{equation}
 f_C(r_{ij}) = \left\{
@@ -165,9 +130,9 @@ f_C(r_{ij}) = \left\{
     \frac{1}{2} + \frac{1}{2} \cos \Big[ \pi (r_{ij} - R_{ij})/(S_{ij} - R_{ij}) \Big], & R_{ij} < r_{ij} < S_{ij} \\
     0, & r_{ij} > S_{ij}
   \end{array} \right.
+\label{eq:basics:fc}
 \end{equation}
-
-The function $b_{ij}$ represents a measure of the bond order, monotonically decreasing with the coordination of atoms $i$ and $j$.
+As discussed above, $b_{ij}$ represents a measure of the bond order, monotonously decreasing with the coordination of atoms $i$ and $j$.
 It is of the form:
 \begin{eqnarray}
 b_{ij} & = & \chi_{ij} (1 + \beta_i^{n_i} \zeta^{n_i}_{ij})^{-1/2n_i} \\
@@ -175,55 +140,536 @@ b_{ij} & = & \chi_{ij} (1 + \beta_i^{n_i} \zeta^{n_i}_{ij})^{-1/2n_i} \\
 g(\theta_{ijk}) & = & 1 + c_i^2/d_i^2 - c_i^2/[d_i^2 + (h_i - \cos \theta_{ijk})^2]
 \end{eqnarray}
 where $\theta_{ijk}$ is the bond angle between bonds $ij$ and $ik$.
-This is illustrated in Figure \ref{img:tersoff_angle}.
+This is illustrated in Fig. \ref{img:tersoff_angle}.
+\begin{figure}[t]
+\begin{center}
+\includegraphics[width=8cm]{tersoff_angle.eps}
+\end{center}
+\caption{Angle between bonds of atoms $i,j$ and $i,k$.}
+\label{img:tersoff_angle}
+\end{figure}
+The angular dependence does not give a fixed minimum angle between bonds since the expression is embedded inside the bond order term.
+The relation to the above discussed bond order potential becomes obvious if $\chi=1, \beta=1, n=1, \omega=1$ and $c=0$.
+Parameters with a single subscript correspond to the parameters of the elemental system \cite{tersoff_si3,tersoff_c} while the mixed parameters are obtained by interpolation from the elemental parameters by the arithmetic or geometric mean.
+The elemental parameters were obtained by fit with respect to the cohesive energies of real and hypothetical bulk structures and the bulk modulus and bond length of the diamond structure.
+New parameters for the mixed system are $\chi$, which is used to finetune the strength of heteropolar bonds, and $\omega$, which is set to one for the C-Si interaction but is available as a feature to permit the application of the potential to more drastically different types of atoms in the future.
+
+The force acting on atom $i$ is given by the derivative of the potential energy.
+For a three body potential ($V_{ij} \neq V{ji}$) the derivation is of the form
+\begin{equation}
+\nabla_{{\bf r}_i} E = \frac{1}{2} \big[ \sum_j ( \nabla_{{\bf r}_i} V_{ij} + \nabla_{{\bf r}_i} V_{ji} ) + \sum_k \sum_j \nabla_{{\bf r}_i} V_{jk} \big] \textrm{ .}
+\end{equation}
+The force is then given by
+\begin{equation}
+F^i = - \nabla_{{\bf r}_i} E \textrm{ .}
+\end{equation}
+Details of the Tersoff potential derivative are presented in appendix \ref{app:d_tersoff}.
+
+\subsubsection{Improved analytical bond order potential}
+
+Although the Tersoff potential is one of the most widely used potentials there are some shortcomings.
+Describing the Si-Si interaction Tersoff was unable to find a single parameter set to describe well both, bulk and surface properties.
+Due to this and since the first approach labeled T1 \cite{tersoff_si1} turned out to be unstable \cite{dodson87}, two further parametrizations exist, T2 \cite{tersoff_si2} and T3 \cite{tersoff_si3}.
+While T2 describes well surface properties, T3 yields improved elastic constants and should be used for describing bulk properties.
+However, T3, which is used in the Si/C potential, suffers from an underestimation of the dimer binding energy.
+Similar behavior is found for the C-C interaction.
+
+For this reason, Erhart and Albe provide a reparametrization of the Tersoff potential based on three independently fitted parameter sets for the Si-Si, C-C and Si-C interaction \cite{albe_sic_pot}.
+The functional form is similar to the one proposed by Tersoff.
+Differences in the energy functional and the force evaluation routine are pointed out in appendix \ref{app:d_tersoff}.
+Concerning Si the elastic properties of the diamond phase as well as the structure and energetics of the dimer are reproduced very well.
+The new parameter set for the C-C interaction yields improved dimer properties while at the same time delivers a description of the bulk phase similar to the Tersoff potential.
+The potential succeeds in the description of the low as well as high coordinated structures.
+The description of elastic properties of SiC is improved with respect to the potentials available in literature.
+Defect properties are only fairly reproduced but the description is comparable to previously published potentials.
+It is claimed that the potential enables modeling of widely different configurations and transitions among these and has recently been used to simulate the inert gas condensation of Si-C nanoparticles \cite{erhart04}.
+Therefore, the Erhart/Albe (EA) potential is considered the superior analytical bond order potential to study the SiC precipitation and associated processes in Si.
+
+\subsection{Verlet integration}
+\label{subsection:integrate_algo}
 
-\printimg{!h}{width=8cm}{tersoff_angle.eps}{Angle between bonds of atoms $i,j$ and $i,k$.}{img:tersoff_angle}
+A numerical method to integrate Newton's equations of motion was presented by Verlet in 1967 \cite{verlet67}.
+The idea of the so-called Verlet and a variant, the velocity Verlet algorithm, which additionaly generates directly the velocities, is explained in the following.
+Starting point is the Taylor series for the particle positions at time $t+\delta t$ and $t-\delta t$
+\begin{equation}
+\vec{r}_i(t+\delta t)=
+\vec{r}_i(t)+\delta t\vec{v}_i(t)+\frac{\delta t^2}{2m_i}\vec{f}_i(t)+
+\frac{\delta t^3}{6}\vec{b}_i(t) + \mathcal{O}(\delta t^4)
+\label{basics:verlet:taylor1}
+\end{equation}
+\begin{equation}
+\vec{r}_i(t-\delta t)=
+\vec{r}_i(t)-\delta t\vec{v}_i(t)+\frac{\delta t^2}{2m_i}\vec{f}_i(t)-
+\frac{\delta t^3}{6}\vec{b}_i(t) + \mathcal{O}(\delta t^4)
+\label{basics:verlet:taylor2}
+\end{equation}
+where $\vec{v}_i=\frac{d}{dt}\vec{r}_i$ are the velocities, $\vec{f}_i=m\frac{d}{dt^2}\vec{r}_i$ are the forces and $\vec{b}_i=\frac{d}{dt^3}\vec{r}_i$ are the third derivatives of the particle positions with respect to time.
+The Verlet algorithm is obtained by summarizing and substracting equations \eqref{basics:verlet:taylor1} and \eqref{basics:verlet:taylor2}
+\begin{equation}
+\vec{r}_i(t+\delta t)=
+2\vec{r}_i(t)-\vec{r}_i(t-\delta t)+\frac{\delta t^2}{m_i}\vec{f}_i(t)+
+\mathcal{O}(\delta t^4)
+\end{equation}
+\begin{equation}
+\vec{v}_i(t)=\frac{1}{2\delta t}[\vec{r}_i(t+\delta t)-\vec{r}_i(t-\delta t)]+
+\mathcal{O}(\delta t^3)
+\end{equation}
+the truncation error of which is of order $\delta t^4$ for the positions and $\delta t^3$ for the velocities.
+The velocities, although not used to update the particle positions, are not synchronously determined with the positions but drag behind one step of discretization.
+The Verlet algorithm can be rewritten into an equivalent form, which updates the velocities and positions in the same step.
+The so-called velocity Verlet algorithm is obtained by combining \eqref{basics:verlet:taylor1} with equation \eqref{basics:verlet:taylor2} displaced in time by $+\delta t$
+\begin{equation}
+\vec{v}_i(t+\delta t)=
+\vec{v}_i(t)+\frac{\delta t}{2m_i}[\vec{f}_i(t)+\vec{f}_i(t+\delta t)]
+\end{equation}
+\begin{equation}
+\vec{r}_i(t+\delta t)=
+\vec{r}_i(t)+\delta t\vec{v}_i(t)+\frac{\delta t^2}{2m_i}\vec{f}_i(t) \text{ .}
+\end{equation}
+Since the forces for the new positions are required to update the velocity the determination of the forces has to be carried out within the integration algorithm.
 
-In order to calculate the forces the derivation of the potential with respect to $x^i_n$ (the $n$th component of the position vector of atom $i$ $\equiv$ ${\bf r}_i$) has to be known.
-This is gradually done in the following.
-The $n$th component of the force acting on atom $i$ is
-\begin{eqnarray}
-F_n^i & = & - \frac{\partial}{\partial x_n^i} \sum_{j \neq i} V_{ij} \nonumber\\
- & = & \sum_{j \neq i} \Big( \partial_{x_n^i} f_C(r_{ij}) \big[ f_R(r_{ij}) + b_{ij} f_A(r_{ij}) \big] + \nonumber\\
-& & + f_C(r_{ij}) \big[ \partial_{x_n^i} f_R(r_{ij}) + b_{ij} \partial_{x_n^i} f_A(r_{ij}) + f_A(r_{ij}) \partial_{x_n^i} b_{ij} \big] \Big) \textrm{ .}
-\end{eqnarray}
-For the implementation it is helpful to seperate the two and three body terms.
-\begin{eqnarray}
-F_n^i & = & \sum_{j \neq i} \Big( f_R(r_{ij}) \partial_{x_n^i} f_C(r_{ij}) + f_C(r_{ij}) \partial_{x_n^i} f_R(r_{ij}) \Big) + \nonumber\\
-& + & \sum_{j \neq i} \Big( \partial_{x_n^i} f_C(r_{ij}) b_ij f_A(r_{ij}) + f_C(r_{ij}) \big[ b_{ij} \partial_{x_n^i} f_A(r_{ij}) + f_A(r_{ij}) \partial_{x_n^i} b_{ij} \big] \Big)
-\end{eqnarray}
-The cutoff function $f_C$ derivated with repect to $x^i_n$ is
+\subsection{Statistical ensembles}
+\label{subsection:statistical_ensembles}
+
+Using the above mentioned algorithms the most basic type of MD is realized by simply integrating the equations of motion of a fixed number of particles ($N$) in a closed volume $V$ realized by periodic boundary conditions (PBC).
+Providing a stable integration algorithm the total energy $E$, i.e. the kinetic and configurational energy of the paticles, is conserved.
+This is known as the $NVE$, or microcanonical ensemble, describing an isolated system composed of microstates, among which the number of particles, volume and energy are held constant.
+
+However, the successful formation of SiC dictates precise control of temperature by external heating.
+While the temperature of such a system is well defined, the energy is no longer conserved.
+The microscopic states of a system, which is in thermal equilibrium with an external thermal heat bath, are represented by the $NVT$ ensemble.
+In the so-called canonical ensemble the temperature $T$ is related to the expactation value of the kinetic energy of the particles, i.e.
 \begin{equation}
-\partial_{x^i_n} f_C(r_{ij}) =
-  - \frac{1}{2} \sin \Big( \pi (r_{ij} - R_{ij}) / (S_{ij} - R_{ij}) \Big) \frac{\pi (x^i_n - x^j_n)}{(S_{ij} - R_{ij}) r_{ij}}
-\label{eq:d_cutoff}
+\langle E_{\text{kin}}\rangle = \frac{3}{2}Nk_{\text{B}}T \text{, }
+E_{\text{kin}}=\sum_i \frac{\vec{p}^2_i}{2m_i} \text{ .}
+\label{eq:basics:ts}
 \end{equation}
-for $R_{ij} < r_{ij} < S_{ij}$ and otherwise zero.
-The derivations of the repulsive and attractive part are:
-\begin{eqnarray}
-\partial_{x_n^i} f_R(r_{ij}) & = & - \lambda_{ij} \frac{x_n^i - x_n^j}{r_{ij}} A_{ij} \exp (-\lambda_{ij} r_{ij})\\
-\partial_{x_n^i} f_A(r_{ij}) & = & \mu_{ij} \frac{x_n^i - x_n^j}{r_{ij}} B_{ij} \exp (-\mu_{ij} r_{ij}) \textrm{ .}
-\end{eqnarray}
-The angle $\theta_{ijk}$ can be expressed by the atom distances with the law of cosines:
-\begin{eqnarray}
-\theta_{ijk} & = & \arccos \Big( (r_{ij}^2 + r_{ik}^2 - r_{jk}^2)/(2 r_{ij} r_{ik}) \Big) \\
-\partial_{x^i_n} \theta_{ijk} & = & 
-\frac{-1}{\sqrt{1 - ((r_{ik}^2+r_{ij}^2-r_{jk}^2)/2r_{ik}r_{ij})^2}} \times \nonumber\\
- & & \times \Big( \frac{4 r_{ik}r_{ij} (2 x^i_n - x^k_n - x^j_n) + 2(x^j_n - x^i_n)\frac{r_{ik}}{r_{ij}} + 2(x^k_n - x^i_n)\frac{r_{ij}}{r_{ik}} }{4 r^2_{ik} r^2_{ij}}\Big) \label{eq:d_theta}
-\end{eqnarray}
-Using the expressions \eqref{eq:d_cutoff} and \eqref{eq:d_theta} the derivation of $b_{ij}$ with respect to $x^i_n$ can be written as:
-\begin{eqnarray}
-\partial_{x^i_n} b_{ij} & = &
-- \frac{1}{2n_i} \chi_{ij} \Bigg( 1 + \beta_i^{n_i} \Bigg[ \sum_{k \ne i,j} \bigg( f_C(r_{ik}) \omega_{ik} \Big( 1 + \frac{c_i^2}{d_i^2} - \frac{c_i^2}{d_i^2 + (h_i - \cos \theta_{ijk})^2} \Big) \bigg)^{n_i} \Bigg] \Bigg)^{-\frac{1}{2n_i} - 1} \times \nonumber\\
-&& \times n_i \beta_i^{n_i} \sum_{k \ne i,j} \Bigg( \Bigg[ f_C(r_{ik}) \omega_{ik} \Big( 1 + \frac{c_i^2}{d_i^2} - \frac{c_i^2}{d_i^2 + (h_i - \cos \theta_{ijk})^2}  \Big) \Bigg]^{n_i -1} \times \nonumber\\
-&& \times \Bigg[ \omega_{ik} \Big( 1 + \frac{c_i^2}{d_i^2} - \frac{c_i^2}{d_i^2 + (h_i - \cos \theta_{ijk})^2} \Big) \partial_{x^i_n} f_C(r_{ik}) + \nonumber\\
-&& + f_C(r_{ik}) \omega_{ik} \frac{c_i^2}{(d_i^2 + (h_i - \cos \theta_{ijk})^2)^2} \times \nonumber\\
-&& \times 2 \Big( h_i - \cos \theta_{ijk} \Big) \sin \theta_{ijk} \partial_{x^i_n} \theta_{ijk} \Bigg] \Bigg)
-\end{eqnarray}
+The volume of the synthesized material can hardly be controlled in experiment.
+Instead the pressure can be adjusted.
+Holding constant the pressure in addition to the temperature of the system its states are represented by the isothermal-isobaric $NpT$ ensemble.
+The expression for the pressure of a system derived from the equipartition theorem is given by
+\begin{equation}
+pV=Nk_{\text{B}}T+\langle W\rangle\text{, }W=-\frac{1}{3}\sum_i\vec{r}_i\nabla_{\vec{r}_i}U
+\text{, }
+\label{eq:basics:ps}
+\end{equation}
+where $W$ is the virial and $U$ is the configurational energy.
+
+Berendsen~et~al.~\cite{berendsen84} proposed a method, which is easy to implement, to couple the system to an external bath with constant temperature $T_0$ or pressure $p_0$ with adjustable time constants $\tau_T$ and $\tau_p$ determining the strength of the coupling.
+Control of the respective variable is based on the relations given in equations \eqref{eq:basics:ts} and \eqref{eq:basics:ps}.
+The thermostat is achieved by scaling the velocities of all atoms in every time step $\delta t$ from $\vec{v}_i$ to $\lambda \vec{v}_i$, with
+\begin{equation}
+\lambda=\left[1+\frac{\delta t}{\tau_T}(\frac{T_0}{T}-1)\right]^\frac{1}{2}
+\text{ ,}
+\end{equation}
+where $T$ is the current temperature according to equation \eqref{eq:basics:ts}.
+The barostat adjusts the pressure by changing the virial through scaling of the particle positions $\vec{r}_i$ to $\mu \vec{r}_i$ and the volume $V$ to $\mu^3 V$, with
+\begin{equation}
+\mu=\left[1-\frac{\beta\delta t}{\tau_p}(p_0-p)\right]^\frac{1}{3}\text{ ,}
+\end{equation}
+where $\beta$ is the isothermal compressibility and $p$ corresponds to the current pressure, which is determined by equation \eqref{eq:basics:ps}.
+
+Using this method the system does not behave like a true $NpT$ ensemble.
+On average $T$ and $p$ correspond to the expected values.
+For large enough time constants, i.e. $\tau > 100 \delta t$, the method shows realistic fluctuations in $T$ and $p$.
+The advantage of the approach is that the coupling can be decreased to minimize the disturbance of the system and likewise be adjusted to suit the needs of a given application.
+It provides a stable algorithm that allows smooth changes of the system to new values of temperature or pressure, which is ideal for the investigated problem.
+
+\section{Denstiy functional theory}
+\label{section:dft}
+
+Dirac declared that chemistry has come to an end, its content being entirely contained in the powerul equation published by Schr\"odinger in 1926 \cite{schroedinger26} marking the beginning of wave mechanics.
+Following the path of Schr\"odinger the problem in quantum-mechanical modeling of describing the many-body problem, i.e. a system of a large amount of interacting particles, is manifested in the high-dimensional Schr\"odinger equation for the wave function $\Psi({\vec{R}},{\vec{r}})$ that depends on the coordinates of all nuclei and electrons.
+The Schr\"odinger equation contains the kinetic energy of the ions and electrons as well as the electron-ion, ion-ion and electron-electron interaction.
+This cannot be solved exactly and finding approximate solutions requires several layers of simplification in order to reduce the number of free parameters.
+Approximations that consider a truncated Hilbert space of single-particle orbitals yield promising results, however, with increasing complexity and demand for high accuracy the amount of Slater determinats to be evaluated massively increases.
+
+In contrast, instead of using the description by the many-body wave function, the key point in density functional theory (DFT) is to recast the problem to a description utilizing the charge density $n(\vec{r})$, which constitutes a quantity in real space depending only on the three spatial coordinates.
+In the following sections the basic idea of DFT will be outlined.
+As will be shown, DFT can formally be regarded as an exactification of the Thomas Fermi theory \cite{thomas27,fermi27} and the self-consistent Hartree equations \cite{hartree28}.
+A nice review is given in the Nobel lecture of Kohn \cite{kohn99}, one of the inventors of DFT.
+
+\subsection{Born-Oppenheimer approximation}
+
+Born and Oppenheimer proposed a simplification enabling the effective decoupling of the electronic and ionic degrees of freedom \cite{born27}.
+Within the Born-Oppenheimer (BO) approximation the light electrons are assumed to move much faster and, thus, follow adiabatically to the motion of the heavy nuclei, if the latter are only slightly deflected from their equilibrium positions.
+Thus, on the timescale of electronic motion the ions appear at fixed positions.
+On the other way round, on the timescale of nuclear motion the electrons appear blurred in space adding an extra term to the ion-ion potential.
+The simplified Schr\"odinger equation no longer contains the kinetic energy of the ions.
+The momentary positions of the ions enter as fixed parameters and, therefore, the ion-ion interaction may be regarded as a constant added to the electronic energies.
+The Schr\"odinger equation describing the remaining electronic problem reads
+\begin{equation}
+\left[-\frac{\hbar^2}{2m}\sum_j\nabla^2_j-
+\sum_{j,l} \frac{Z_le^2}{|\vec{r}_j-\vec{R}_l|}+
+\frac{1}{2}\sum_{j\neq j'}\frac{e^2}{|\vec{r}_j-\vec{r}_{j'}|}
+\right] \Psi = E \Psi
+\text{ ,}
+\end{equation}
+where $Z_l$ are the atomic numbers of the nuclei and $\Psi$ is the many-electron wave function, which depends on the positions and spins of the electrons.
+Accordingly, there is only a parametrical dependence on the ionic coordinates $\vec{R}_l$.
+However, the remaining number of free parameters is still too high and need to be further decreased.
 
+\subsection{Hohenberg-Kohn theorem and variational principle}
 
-\subsubsection{The Brenner potential}
+Investigating the energetics of Cu$_x$Zn$_{1-x}$ alloys, which for different compositions exhibit different transfers of charge between the Cu and Zn unit cells due to their chemical difference and, thus, varying electrostatic interactions contributing to the total energy, the work of Hohenberg and Kohn had a natural focus on the distribution of charge.
+Although it was clear that the Thomas Fermi (TF) theory only provides a rough approximation to the exact solution of the many-electron Schr\"odinger equation the theory was of high interest since it provides an implicit relation of the potential and the electron density distribution.
+This raised the question how to establish a connection between TF expressed in terms of $n(\vec{r})$ and the exact Schr\"odinger equation expressed in terms of the many-electron wave function $\Psi({\vec{r}})$ and whether a complete description in terms of the charge density is possible in principle.
+The answer to this question, whether the charge density completely characterizes a system, became the starting point of modern DFT.
 
-\subsection{Statistical ensembles}
-\label{subsection:statistical_ensembles}
+Considering a system with a nondegenerate ground state there is obviously only one ground-state charge density $n_0(\vec{r})$ that correpsonds to a given potential $V(\vec{r})$.
+In 1964 Hohenberg and Kohn showed the opposite and far less obvious result \cite{hohenberg64}.
+Employing no more than the Rayleigh-Ritz minimal principle it is concluded by {\em reductio ad absurdum} that for a nondegenerate ground state the same charge density cannot be generated by different potentials.
+Thus, the charge density of the ground state $n_0(\vec{r})$ uniquely determines the potential $V(\vec{r})$ and, consequently, the full Hamiltonian and ground-state energy $E_0$.
+In mathematical terms the full many-electron ground state is a unique functional of the charge density.
+Im particular, $E$ is a functional $E[n(\vec{r})]$ of $n(\vec{r})$.
+
+The ground-state charge density $n_0(\vec{r})$ minimizes the energy functional $E[n(\vec{r})]$, its value corresponding to the ground-state energy $E_0$, which enables the formulation of a minimal principle in terms of the charge density \cite{hohenberg64,levy82}
+\begin{equation}
+E_0=\min_{n(\vec{r})}
+ \left\{
+  F[n(\vec{r})] + \int n(\vec{r}) V(\vec{r}) d\vec{r}
+ \right\}
+ \text{ ,}
+\label{eq:basics:hkm}
+\end{equation}
+where $F[n(\vec{r})]$ is a universal functional of the charge density $n(\vec{r})$, which is composed of the kinetic energy functional $T[n(\vec{r})]$ and the interaction energy functional $U[n(\vec{r})]$.
+The challenging problem of determining the exact ground-state is now formally reduced to the determination of the $3$-dimensional function $n(\vec{r})$, which minimizes the energy functional.
+However, the complexity associated with the many-electron problem is now relocated in the task of finding the well-defined but, in contrast to the potential energy, not explicitly known functional $F[n(\vec{r})]$.
+
+It is worth to note, that this minimal principle may be regarded as exactification of the TF theory, which is rederived by the approximations
+\begin{equation}
+T=\int n(\vec{r})\frac{3}{10}k_{\text{F}}^2(n(\vec{r}))d\vec{r}
+\text{ ,}
+\end{equation}
+\begin{equation}
+U=\frac{1}{2}\int\frac{n(\vec{r})n(\vec{r}')}{|\vec{r}-\vec{r}'|}d\vec{r}d\vec{r}'
+\text{ .}
+\end{equation}
+
+\subsection{Kohn-Sham system}
+
+Inspired by the Hartree equations, i.e. a set of self-consistent single-particle equations for the approximate solution of the many-electron problem \cite{hartree28}, which describe atomic ground states much better than the TF theory, Kohn and Sham presented a Hartree-like formulation of the Hohenberg and Kohn minimal principle \eqref{eq:basics:hkm} \cite{kohn65}.
+However, due to a more general approach, the new formulation is formally exact by introducing the energy functional $E_{\text{xc}}[n(vec{r})]$, which accounts for the exchange and correlation energy of the electron interaction $U$ and possible corrections due to electron interaction to the kinetic energy $T$.
+The respective Kohn-Sham equations for the effective single-particle wave functions $\Phi_i(\vec{r})$ take the form
+\begin{equation}
+\left[
+ -\frac{\hbar^2}{2m}\nabla^2 + V_{\text{eff}}(\vec{r})
+\right] \Phi_i(\vec{r})=\epsilon_i\Phi_i(\vec{r})
+\label{eq:basics:kse1}
+\text{ ,}
+\end{equation}
+\begin{equation}
+V_{\text{eff}}(\vec{r})=V(\vec{r})+\int\frac{e^2n(\vec{r}')}{|\vec{r}-\vec{r}'|}d\vec{r}'
+ + V_{\text{xc}(\vec{r})}
+\text{ ,}
+\label{eq:basics:kse2}
+\end{equation}
+\begin{equation}
+n(\vec{r})=\sum_{i=1}^N |\Phi_i(\vec{r})|^2
+\text{ ,}
+\label{eq:basics:kse3}
+\end{equation}
+where the local exchange-correlation potential $V_{\text{xc}}(\vec{r})$ is the partial derivative of the exchange-correlation functional $E_{\text{xc}}[n(\vec{r})]$ with respect to the charge density $n(\vec{r})$ for the ground-state $n_0(\vec{r})$.
+The first term in equation \eqref{eq:basics:kse1} corresponds to the kinetic energy of non-interacting electrons and the second term of equation \eqref{eq:basics:kse2} is just the Hartree contribution $V_{\text{H}}(\vec{r})$ to the interaction energy.
+%\begin{equation}
+%V_{\text{xc}}(\vec{r})=\frac{\partial}{\partial n(\vec{r})}
+% E_{\text{xc}}[n(\vec{r})] |_{n(\vec{r})=n_0(\vec{r})}
+%\end{equation}
+
+The system of interacting electrons is mapped to an auxiliary system, the Kohn-Sham (KS) system, of non-interacting electrons in an effective potential.
+The exact effective potential $V_{\text{eff}}(\vec{r})$ may be regarded as a fictious external potential yielding a gound-state density for non-interacting electrons, which is equal to that for interacting electrons in the external potential $V(\vec{r})$.
+The one-electron KS orbitals $\Phi_i(\vec{r})$ as well as the respective KS energies $\epsilon_i$ are not directly attached to any physical observable except for the ground-state density, which is determined by equation \eqref{eq:basics:kse3} and the ionization energy, which is equal to the highest occupied relative to the vacuum level.
+The KS equations may be considered the formal exactification of the Hartree theory, which it is reduced to if the exchange-correlation potential and functional are neglected.
+In addition to the Hartree-Fock (HF) method, KS theory includes the difference of the kinetic energy of interacting and non-interacting electrons as well as the remaining contributions to the correlation energy that are not part of the HF correlation.
+
+The self-consistent KS equations \eqref{eq:basics:kse1}, \eqref{eq:basics:kse2} and \eqref{eq:basics:kse3} are non-linear partial differential equations, which may be solved numerically by an iterative process.
+Starting from a first approximation for $n(\vec{r})$ the effective potential $V_{\text{eff}}(\vec{r})$ can be constructed followed by determining the one-electron orbitals $\Phi_i(\vec{r})$, which solve the single-particle Schr\"odinger equation for the respective potential.
+The $\Phi_i(\vec{r})$ are used to obtain a new expression for $n(\vec{r})$.
+These steps are repeated until the initial and new density are equal or reasonably converged.
+
+Again, it is worth to note that the KS equations are formally exact.
+Assuming exact functionals $E_{\text{xc}}[n(\vec{r})]$ and potentials $V_{\text{xc}}(\vec{r})$ all many-body effects are included.
+Clearly, this directs attention to the functional, which now contains the costs involved with the many-electron problem.
+
+\subsection{Approximations for exchange and correlation}
+\label{subsection:ldagga}
+
+As discussed above, the HK and KS formulations are exact and so far no approximations except the adiabatic approximation entered the theory.
+However, to make concrete use of the theory, effective approximations for the exchange and correlation energy functional $E_{\text{xc}}[n(\vec{r})]$ are required.
+
+Most simple and at the same time remarkably useful is the approximation of $E_{\text{xc}}[n(\vec{r})]$ by a function of the local density \cite{kohn65}
+\begin{equation}
+E^{\text{LDA}}_{\text{xc}}[n(\vec{r})]=\int\epsilon_{\text{xc}}(n(\vec{r}))n(\vec{r}) d\vec{r}
+\text{ ,}
+\label{eq:basics:xca}
+\end{equation}
+which is, thus, called local density approximation (LDA).
+Here, the exchange-correlation energy per particle of the uniform electron gas of constant density $n$ is used for $\epsilon_{\text{xc}}(n(\vec{r}))$.
+Although, even in such a simple case, no exact form of the correlation part of $\epsilon_{\text{xc}}(n)$ is known, highly accurate numerical estimates using Monte Carlo methods \cite{ceperley80} and corresponding paramterizations exist \cite{perdew81}.
+Obviously exact for the homogeneous electron gas, the LDA was {\em a priori} expected to be useful only for densities varying slowly on scales of the local Fermi or TF wavelength.
+Nevertheless, LDA turned out to be extremely successful in describing some properties of highly inhomogeneous systems accurately within a few percent.
+Although LDA is known to overestimate the cohesive energy in solids by \unit[10-20]{\%}, the lattice parameters are typically determined with an astonishing accuracy of about \unit[1]{\%}.
+
+More accurate approximations of the exchange-correlation functional are realized by the introduction of gradient corrections with respect to the density \cite{kohn65}.
+Respective considerations are based on the concept of an exchange-correlation hole density describing the depletion of the electron density in the vicinity of an electron.
+The averaged hole density can be used to give a formally exact expression for $E_{\text{xc}}[n(\vec{r})]$ and an equivalent expression \cite{kohn96,kohn98}, which makes use of the electron density distribution $n(\tilde{\vec{r}})$ at positions $\tilde{\vec{r}}$ near $\vec{r}$, yielding the form
+\begin{equation}
+E_{\text{xc}}[n(\vec{r})]=\int\epsilon_{\text{xc}}(\vec{r};[n(\tilde{\vec{r}})])n(\vec{r}) d\vec{r}
+\end{equation}
+for the exchange-correlation energy, where $\epsilon_{\text{xc}}(\vec{r};[n(\tilde{\vec{r}})])$ becomes a nearsighted functional of $n(\tilde{\vec{r}})$.
+Expressing $n(\tilde{\vec{r}})$ in a Taylor series, $\epsilon_{\text{xc}}$ can be thought of as a function of coefficients, which correspond to the respective terms of the expansion.
+Neglecting all terms of order $\mathcal{O}(\nabla n(\vec{r}))$ results in the functional equal to LDA, which requires the function of variable $n$.
+Including the next element of the Taylor series introduces the gradient correction to the functional, which requires the function of variables $n$ and $|\nabla n|$.
+This is called the generalized-gradient approximation (GGA), which expresses the exchange-correlation energy density as a function of the local density and the local gradient of the density
+\begin{equation}
+E^{\text{GGA}}_{\text{xc}}[n(\vec{r})]=\int\epsilon_{\text{xc}}(n(\vec{r}),|\nabla n(\vec{r})|)n(\vec{r}) d\vec{r}
+\text{ .}
+\end{equation}
+These functionals constitute the simplest extensions of LDA for inhomogeneous systems.
+At modest computational costs gradient-corrected functionals very often yield much better results than the LDA with respect to cohesive and binding energies.
+
+\subsection{Plane-wave basis set}
+
+Finally, a set of basis functions is required to represent the one-electron KS wave functions.
+With respect to the numerical treatment it is favorable to approximate the wave functions by linear combinations of a finite number of such basis functions.
+Covergence of the basis set, i.e. convergence of the wave functions with respect to the amount of basis functions, is most crucial for the accuracy of the numerical calulations.
+Two classes of basis sets, the plane-wave and local basis sets, exist.
+
+Local basis set functions usually are atomic orbitals, i.e. mathematical functions that describe the wave-like behavior of electrons, which are localized, i.e. centered on atoms or bonds.
+Molecular orbitals can be represented by linear combinations of atomic orbitals (LCAO).
+By construction, only a small number of basis functions is required to represent all of the electrons of each atom within reasonable accuracy.
+Thus, local basis sets enable the implementation of methods that scale linearly with the number of atoms.
+However, these methods rely on the fact that the wave functions are localized and exhibit an exponential decay resulting in a sparse Hamiltonian.
+
+Another approach is to represent the KS wave functions by plane waves.
+In fact, the employed {\textsc vasp} software is solving the KS equations within a plane-wave (PW) basis set.
+The idea is based on the Bloch theorem \cite{bloch29}, which states that in a periodic crystal each electronic wave function $\Phi_i(\vec{r})$ can be written as the product of a wave-like envelope function $\exp(i\vec{kr})$ and a function that has the same periodicity as the lattice.
+The latter one can be expressed by a Fourier series, i.e. a discrete set of plane waves whose wave vectors just correspond to reciprocal lattice vectors $\vec{G}$ of the crystal.
+Thus, the one-electron wave function $\Phi_i(\vec{r})$ associated with the wave vector $\vec{k}$ can be expanded in terms of a discrete PW basis set
+\begin{equation}
+\Phi_i(\vec{r})=\sum_{\vec{G}
+%, |\vec{G}+\vec{k}|<G_{\text{cut}}}
+}c_{i,\vec{k}+\vec{G}} \exp\left(i(\vec{k}+\vec{G})\vec{r}\right)
+\text{ .}
+%E_{\text{cut}}=\frac{\hbar^2 G^2_{\text{cut}}}{2m}
+%\text{, }
+\end{equation}
+The basis set, which in principle should be infinite, can be truncated to include only plane waves that have kinetic energies $\hbar^2|\vec{k}+\vec{G}|^2/2m$ less than a particular cut-off energy $E_{\text{cut}}$.
+Although coefficients $c_{i,\vec{k}+\vec{G}}$ corresponding to small kinetic energies are typically more important, convergence with respect to the cut-off energy is crucial for the accuracy of the calculations.
+Convergence with respect to the basis set, however, is easily achieved by increasing $E_{\text{cut}}$ until the respective differences in total energy approximate zero.
+
+Next to their simplicity, plane waves have several advantages.
+The basis set is orthonormal by construction and, as mentioned above, it is simple to check for convergence.
+The biggest advantage, however, is the ability to perform exact calculations by a discrete sum over a numerical grid.
+This is due to the related construction of the grid and the PW basis.
+Ofcourse, exactness is restricted by the fact that the PW basis set is finite.
+The simple form of the PW representation of the KS equations
+\begin{equation}
+\sum_{\vec{G}'} \left[
+ \frac{\hbar^2}{2m}|\vec{k}+\vec{G}|^2 \delta_{\vec{GG}'}
+ + \tilde{V}(\vec{G}-\vec{G}')
+ + \tilde{V}_{\text{H}}(\vec{G}-\vec{G}')
+ + \tilde{V}_{\text{xc}}(\vec{G}-\vec{G}')
+\right] c_{i,\vec{k}+\vec{G}} = \epsilon_i c_{i,\vec{k}+\vec{G}}
+\label{eq:basics:pwks}
+\end{equation}
+reveals further advantages.
+The various potentials are described in terms of their Fourier transforms.
+Equation \eqref{eq:basics:pwks} is solved by diagonalization of the Hamiltonian matrix $H_{\vec{k}+\vec{G},\vec{k}+\vec{G}'}$ given by the terms in the brackets.
+The gradient operator is diagonal in reciprocal space whereas the exchange-correlation potential has a diagonal representation in real space.
+This suggests to carry out different operations in real and reciprocal space, which requires frequent Fourier transformations.
+These, however, can be efficiently achieved by the fast Fourier transformation (FFT) algorithm.
+
+There are likewise disadvantages associated with the PW representation.
+By construction, PW calculations require a periodic system.
+This does not pose a severe problem since non-periodic systems can still be described by a suitable choice of the simulation cell.
+Describing a defect, for instance, requires the inclusion of enough bulk material in the simulation to prevent or reduce the interaction with its periodic, artificial images.
+As a consequence the number of atoms involved in the calculations are increased.
+To describe surfaces, sufficiently thick vacuum layers need to be included to avoid interaction of adjacent crystal slabs.
+Clearly, to appropriately approximate the wave functions and the respective charge density of a system composed of vacuum in addition to the solid in a PW basis, an increase of the cut-off energy is required.
+According to equation \eqref{eq:basics:pwks} the size of the Hamiltonian depends on the cut-off energy and, therefore, the computational effort is likewise increased.
+For the same reason, the description of tightly bound core electrons and the respective, highly localized charge density is hindered.
+However, a much more profound problem exists whenever wave functions for the core as well as the valence electrons need to be calculated within a PW basis set.
+Wave functions of the valence electrons exhibit rapid oscillations in the region occupied by the core electrons near the nuclei.
+The oscillations maintain the orthogonality between the wave functions of the core and valence electrons, which is compulsory due to the exclusion principle.
+Accurately approximating these oscillations demands for an extremely large PW basis set, which is too large for practical use.
+Fortunately, the impossibility to model the core in addition to the valence electrons is eliminated in the pseudopotential approach discussed in the next section.
+
+\subsection{Pseudopotentials}
+
+As discussed in the last part of the previous section, an extremely large basis set of plane waves would be required to perform an all-electron calculation and a vast amount of computational time would be required to calculate the electronic wave functions.
+It is worth to stress out one more time, that this is mainly due to the orthogonalization wiggles of the wave functions of valence electrons near the nuclei.
+Thus, existing core states practically prevent the use of a PW basis set.
+However, the core electrons, which are tightly bound to the nuclei, do not contribute significantly to chemical bonding or other physical properties of the solid.
+This fact is exploited in the pseudopotential (PP) approach \cite{cohen70} by removing the core electrons and replacing the atom and the associated strong ionic potential by a pseudoatom and a weaker PP that acts on a set of pseudo wave functions rather than the true valance wave functions.
+This way, the pseudo wave functions become smooth near the nuclei.
+
+Most PPs statisfy four general conditions.
+The pseudo wave functions generated by the PP should not contain nodes, i.e. the pseudo wave functions should be smooth and free of wiggles in the core region.
+Outside the core region, the pseudo and real valence wave functions as well as the generated charge densities need to be identical.
+The charge enclosed within the core region must be equal for both wave functions.
+Last, almost redundantly, the valence all-electron and pseudopotential eigenvalues must be equal.
+Pseudopotentials that meet the conditions outlined above are referred to as norm-conserving pseudopotentials \cite{hamann79}.
+
+%Certain properties need to be fulfilled by PPs and the resulting pseudo wave functions.
+%The pseudo wave functions should yield the same energy eigenvalues than the true valence wave functions.
+%The PP is called norm-conserving if the pseudo and real charge contained within the core region matches.
+%To guarantee transferability of the PP the logarithmic derivatives of the real and pseudo wave functions and their first energy derivatives need to agree outside of the core region.
+%A simple procedure was proposed to extract norm-conserving PPs obyeing the above-mentioned conditions from {\em ab initio} atomic calculations \cite{hamann79}.
+
+In order to achieve these properties different PPs are required for the different shapes of the orbitals, which are determined by their angular momentum.
+Mathematically, a non-local PP, which depends on the angular momentum, has the form
+\begin{equation}
+V_{\text{nl}}(\vec{r}) = \sum_{lm} \mid lm \rangle V_l(\vec{r}) \langle lm \mid
+\text{ .}
+\end{equation}
+Applying of the operator $V_{\text{nl}}(\vec{r})$ decomposes the electronic wave functions into spherical harmonics $\mid lm \rangle$, i.e. the orbitals with azimuthal angular momentum $l$ and magnetic number $m$, which are then multiplied by the respective psuedopotential $V_l(\vec{r})$ for angular momentum $l$.
+The standard generation procedure of pseudopotentials proceeds by varying its parameters until the pseudo eigenvalues are eual to the all-electron valence eigenvalues and the pseudo wave functions match the all-electron valence wave functions beyond a certain cut-off radius detrmining the core region.
+Modified methods to generate ultra-soft pseudopotentials were proposed, which address the rapid convergence with respect to the size of the plane wave basis set \cite{vanderbilt90,troullier91}.
+
+Using PPs the rapid oscillations of the wave functions near the core of the atoms are removed considerably reducing the number of plane waves necessary to appropriately expand the wave functions.
+More importantly, less accuracy is required compared to all-electron calculations to determine energy differences among ionic configurations, which almost totally appear in the energy of the valence electrons that are typically a factor $10^3$ smaller than the energy of the core electrons.
+
+\subsection{Brillouin zone sampling}
+\label{subsection:basics:bzs}
+
+Following Bloch's theorem only a finite number of electronic wave functions need to be calculated for a periodic system.
+However, to calculate quantities like the total energy or charge density, these have to be evaluated in a sum over an infinite number of $\vec{k}$ points.
+Since the values of the wave function within a small interval around $\vec{k}$ are almost identical, it is possible to approximate the infinite sum by a sum over an affordable number of $k$ points, each representing the respective region of the wave function in $\vec{k}$ space. 
+Methods have been derived for obtaining very accurate approximations by a summation over special sets of $\vec{k}$ points with distinct, associated weights \cite{baldereschi73,chadi73,monkhorst76}.
+If present, symmetries in reciprocal space may further reduce the number of calculations.
+For supercells, i.e. repeating unit cells that contain several primitive cells, restricting the sampling of the Brillouin zone (BZ) to the $\Gamma$ point can yield quite accurat results.
+In fact, with respect to BZ sampling, calculating wave functions of a supercell containing $n$ primitive cells for only one $\vec{k}$ point is equivalent to the scenario of a single primitive cell and the summation over $n$ points in $\vec{k}$ space.
+In general, finer $\vec{k}$ point meshes better account for the periodicity of a system, which in some cases, however, might be fictious anyway.
+
+\subsection{Structural relaxation and Hellmann-Feynman theorem}
+
+Up to this point, the system is in the ground state with respect to the electronic subsystem, while the positions of the ions as well as size and shape of the supercell are fixed.
+To investigate equilibrium structures, however, the ionic subsystem must also be allowed to relax into a minimum energy configuration.
+Local minimum configurations can be easily obtained in a MD-like way by moving the nuclei over small distances along the directions of the forces, as discussed in the MD chapter above.
+Clearly, the conjugate gradient method constitutes a more sophisticated scheme, which will locate the equilibrium positions of the ions more rapidly.
+To find the global minimum, i.e. the absolute ground state, methods like simulated annealing or the Monte Carlo technique, which allow the system to escape local minima, have to be used for the search.
+
+The force on an ion is given by the negative derivative of the total energy with respect to the position of the ion.
+However, moving an ion, i.e. altering its position, changes the wave functions to the KS eigenstates corresponding to the new ionic configuration.
+Writing down the derivative of the total energy $E$ with respect to the position $\vec{R}_i$ of ion $i$
+\begin{equation}
+\frac{dE}{d\vec{R_i}}=
+ \sum_j \Phi_j^* \frac{\partial H}{\partial \vec{R}_i} \Phi_j
++\sum_j \frac{\partial \Phi_j^*}{\partial \vec{R}_i} H \Phi_j
++\sum_j \Phi_j^* H \frac{\partial \Phi_j}{\partial \vec{R}_i}
+\text{ ,}
+\end{equation}
+indeed reveals a contributon to the chnage in total energy due to the change of the wave functions $\Phi_j$.
+However, provided that the $\Phi_j$ are eigenstates of $H$, it is easy to show that the last two terms cancel each other and in the special case of $H=T+V$ the force is given by
+\begin{equation}
+\vec{F}_i=-\sum_j \Phi_j^*\Phi_j\frac{\partial V}{\partial \vec{R}_i}
+\text{ .}
+\end{equation}
+This is called the Hellmann-Feynman theorem \cite{feynman39}, which enables the calculation of forces, called the Hellmann-Feynman forces, acting on the nuclei for a given configuration, without the need for evaluating computationally costly energy maps.
+
+\section{Modeling of point defects}
+\label{section:basics:defects}
+
+Point defects are defects that affect a single lattice site.
+At this site the crystalline periodicity is interrupted.
+An empty lattice site, which would be occupied in the perfect crystal structure, is called a vacancy defect.
+If an additional atom is incorporated into the perfect crystal, this is called interstitial defect.
+A substitutional defect exists, if an atom belonging to the perfect crystal is replaced with an atom of another species.
+The disturbance caused by these defects may result in the distortion of the surrounding atomic structure and is accompanied by an increase in configurational energy.
+Thus, next to the structure of the defect, the energy needed to create such a defect, i.e. the defect formation energy, is an important value characterizing the defect and likewise determining its relative stability.
+
+The formation energy of a defect is defined by
+\begin{equation}
+E_{\text{f}}=E-\sum_i N_i\mu_i
+\text{ ,}
+\label{eq:basics:ef2}
+\end{equation}
+where $E$ is the total energy of the interstitial structure involving $N_i$ atoms of type $i$ with chemical potential $\mu_i$.
+Here, the chemical potentials are determined by the chemical potential of the respective equilibrium bulk structure, i.e. the cohesive energy per atom for the fully relaxed structure at zero temperature and pressure.
+Considering C interstitial defects in Si, the chemical potential for C could also be determined by the cohesive energies of Si and SiC according to the relation $\mu_{\text{C}}=\mu_{\text{SiC}}-\mu_{\text{Si}}$ of the chemical potentials.
+In this way, SiC is chosen as a reservoir for the C impurity.
+For defect configurations consisting of a single atom species the formation energy reduces to
+\begin{equation}
+E_{\text{f}}=\left(E_{\text{coh}}^{\text{defect}}
+                  -E_{\text{coh}}^{\text{defect-free}}\right)N
+\text{ ,}
+\label{eq:basics:ef1}
+\end{equation}
+where $N$ and $E_{\text{coh}}^{\text{defect}}$ are the number of atoms and the cohesive energy per atom in the defect configuration and $E_{\text{coh}}^{\text{defect-free}}$ is the cohesive energy per atom of the defect-free structure.
+Clearly, for a single atom species equation \eqref{eq:basics:ef2} is equivalent to equation \eqref{eq:basics:ef1} since $NE_{\text{coh}}^{\text{defect}}$ is equal to the total energy of the defect structure and $NE_{\text{coh}}^{\text{defect-free}}$ corresponds to $N\mu$, provided the structure is fully relaxed at zero temperature.
+
+However, there is hardly ever only one defect in a crystal, not even only one kind of defect.
+Again, energetic considerations can be used to investigate the existing interaction of two defects.
+The binding energy $E_{\text{b}}$ of a defect pair is given by the difference of the formation energy of the defect combination $E_{\text{f}}^{\text{comb}} $ and the sum of the two separated defect configurations $E_{\text{f}}^{1^{\text{st}}}$ and $E_{\text{f}}^{2^{\text{nd}}}$.
+This can be expressed by
+\begin{equation}
+E_{\text{b}}=
+E_{\text{f}}^{\text{comb}}-
+E_{\text{f}}^{1^{\text{st}}}-
+E_{\text{f}}^{2^{\text{nd}}}
+\label{eq:basics:e_bind}
+\end{equation}
+where the formation energies $E_{\text{f}}^{\text{comb}}$, $E_{\text{f}}^{1^{\text{st}}}$ and $E_{\text{f}}^{2^{\text{nd}}}$ are determined as discussed above.
+Accordingly, energetically favorable configurations result in binding energies below zero while unfavorable configurations show positive values for the binding energy.
+The interaction strength, i.e. the absolute value of the binding energy, approaches zero for increasingly non-interacting isolated defects.
+Thus, $E_{\text{b}}$ indeed can be best thought of a binding energy, which is required to bring the defects to infinite separation.
+
+The methods presented in the last two chapters can be used to investigate defect structures and energetics.
+Therefore, a supercell containing the perfect crystal is generated in an initial process.
+If not by construction, the system should be fully relaxed.
+The substitutional or vacancy defect is realized by replacing or removing one atom contained in the supercell.
+Interstitial defects are created by adding an atom at positions located in the space between regular lattice sites.
+Once the intuitively created defect structure is generated structural relaxation methods will yield the respective local minimum configuration.
+Since the supercell approach applies periodic boundary conditions enough bulk material surrounding the defect is required to exclude possible interaction of the defect with its periodic image.
+
+\begin{figure}[t]
+\begin{center}
+\includegraphics[width=9cm]{unit_cell_e.eps}
+\end{center}
+\caption[Insertion positions for interstitial defect atoms in the diamond lattice.]{Insertion positions for the tetrahedral ({\color{red}$\bullet$}), hexagonal  ({\color{green}$\bullet$}), \hkl<1 0 0> dumbbell ({\color{yellow}$\bullet$}), \hkl<1 1 0> dumbbell ({\color{magenta}$\bullet$}) and bond-centered ({\color{cyan}$\bullet$}) interstitial defect atom in the diamond lattice. The black dots correspond to the lattice atoms and the blue lines indicate the covalent bonds of the perfect diamond structure.}
+\label{fig:basics:ins_pos}
+\end{figure}
+The respective estimated interstitial insertion positions for various interstitial structures in a diamond lattice are displayed in Fig. \ref{fig:basics:ins_pos}.
+The labels of the interstitial types indicate their positions in the interstitial lattice.
+In a dumbbell (DB) configuration two atoms share a single lattice site along a certain direction that is also comprehended in the label of the defect.
+For the DB configurations the nearest atom of the bulk lattice is slightly displaced by $(0,0,-1/8)$ and $(-1/8,-1/8,0)$ of the unit cell length respectively.
+This is indicated by the dashed, unfilled circles.
+By this, high forces, which might enable the system to overcome barriers of the local minimum configuration and, thus, result in a different structure, are avoided.
+
+\section{Migration paths and diffusion barriers}
+\label{section:basics:migration}
+
+Investigating diffusion mechanisms is based on determining migration paths in between two local minimum configurations of an atom at different locations in the lattice.
+During migration, the total energy of the system increases, traverses at least one maximum of the configurational energy and finally decreases to a local minimum value.
+The maximum difference in energy is the barrier necessary for the respective migration process.
+The path exhibiting the minimal energy difference determines the diffusion path and associated diffusion barrier and the maximum configuration turns into a saddle point configuration.
+
+\begin{figure}[t]
+\begin{center}
+\subfigure[]{\label{fig:basics:crto}\includegraphics[width=0.45\textwidth]{crt_orig.eps}}
+\subfigure[]{\label{fig:basics:crtm}\includegraphics[width=0.45\textwidth]{crt_mod.eps}}
+\end{center}
+\caption{Schematic of the constrained relaxation technique (a) and of a modified version (b) used to obtain migration pathways and corresponding configurational energies.}
+\label{fig:basics:crt}
+\end{figure}
+One possibility to compute the migration path from one stable cofiguration into another one is provided by the constrained relaxation technique (CRT) \cite{kaukonen98}.
+The atoms involving great structural changes in the diffusion process are moved stepwise from the starting to the final position and relaxation after each step is only allowed in the plane perpendicular to the direction of the vector connecting its starting and final position.
+This is illustrated in Fig. \ref{fig:basics:crto}.
+The number of steps required for smooth transitions depends on the shape of the potential energy surface.
+No constraints are applied to the remaining atoms to allow for the relaxation of the surrounding lattice.
+To prevent the remaining lattice to shift according to the displacement of the defect, ohowever, some atoms far away from the defect region should be fixed in all three coordinate directions.
+However, for the present study, the method tremendously failed.
+Abrupt changes in structure and configurational energy occured among relaxed structures of two successive displacement steps.
+For some structures even the expected final configurations are not obtained.
+Thus, the method mentioned above is adjusted adding further constraints in order to obtain smooth transitions with repsect to energy and structure.
+In the modified method all atoms are stepwise displaced towards their final positions.
+In addition to this, relaxation of each individual atom is only allowed in the plane perpendicular to the last individual displacement vector, as displayed in Fig. \ref{fig:basics:crtm}.
+In the modified version respective energies could be higher than the real ones due to the additional constraints that prevent a more adequate relaxation until the final copnfiguration is reached.
+
+Structures of maximum configurational energy do not necessarily constitute saddle point configurations, i .e. the method does not guarantee to find the true minimum energy path.
+Whether a saddle point configuration and, thus, the minimum energy path is obtained by the CRT method, needs to be verified by caculating the respective vibrational modes.
+Modifications used to add the CRT feature to the VASP code and a short instruction on how to use it can be found in appendix \ref{app:patch_vasp}.
+
+% todo - advantages of pw basis concenring hf forces