xref: /openbmc/linux/fs/overlayfs/dir.c (revision a105d685)
1e9be9d5eSMiklos Szeredi /*
2e9be9d5eSMiklos Szeredi  *
3e9be9d5eSMiklos Szeredi  * Copyright (C) 2011 Novell Inc.
4e9be9d5eSMiklos Szeredi  *
5e9be9d5eSMiklos Szeredi  * This program is free software; you can redistribute it and/or modify it
6e9be9d5eSMiklos Szeredi  * under the terms of the GNU General Public License version 2 as published by
7e9be9d5eSMiklos Szeredi  * the Free Software Foundation.
8e9be9d5eSMiklos Szeredi  */
9e9be9d5eSMiklos Szeredi 
10e9be9d5eSMiklos Szeredi #include <linux/fs.h>
11e9be9d5eSMiklos Szeredi #include <linux/namei.h>
12e9be9d5eSMiklos Szeredi #include <linux/xattr.h>
13e9be9d5eSMiklos Szeredi #include <linux/security.h>
14e9be9d5eSMiklos Szeredi #include <linux/cred.h>
15e9be9d5eSMiklos Szeredi #include "overlayfs.h"
16e9be9d5eSMiklos Szeredi 
17e9be9d5eSMiklos Szeredi void ovl_cleanup(struct inode *wdir, struct dentry *wdentry)
18e9be9d5eSMiklos Szeredi {
19e9be9d5eSMiklos Szeredi 	int err;
20e9be9d5eSMiklos Szeredi 
21e9be9d5eSMiklos Szeredi 	dget(wdentry);
22e9be9d5eSMiklos Szeredi 	if (S_ISDIR(wdentry->d_inode->i_mode))
23e9be9d5eSMiklos Szeredi 		err = ovl_do_rmdir(wdir, wdentry);
24e9be9d5eSMiklos Szeredi 	else
25e9be9d5eSMiklos Szeredi 		err = ovl_do_unlink(wdir, wdentry);
26e9be9d5eSMiklos Szeredi 	dput(wdentry);
27e9be9d5eSMiklos Szeredi 
28e9be9d5eSMiklos Szeredi 	if (err) {
29e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: cleanup of '%pd2' failed (%i)\n",
30e9be9d5eSMiklos Szeredi 		       wdentry, err);
31e9be9d5eSMiklos Szeredi 	}
32e9be9d5eSMiklos Szeredi }
33e9be9d5eSMiklos Szeredi 
34e9be9d5eSMiklos Szeredi struct dentry *ovl_lookup_temp(struct dentry *workdir, struct dentry *dentry)
35e9be9d5eSMiklos Szeredi {
36e9be9d5eSMiklos Szeredi 	struct dentry *temp;
37e9be9d5eSMiklos Szeredi 	char name[20];
38e9be9d5eSMiklos Szeredi 
39e9be9d5eSMiklos Szeredi 	snprintf(name, sizeof(name), "#%lx", (unsigned long) dentry);
40e9be9d5eSMiklos Szeredi 
41e9be9d5eSMiklos Szeredi 	temp = lookup_one_len(name, workdir, strlen(name));
42e9be9d5eSMiklos Szeredi 	if (!IS_ERR(temp) && temp->d_inode) {
43e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: workdir/%s already exists\n", name);
44e9be9d5eSMiklos Szeredi 		dput(temp);
45e9be9d5eSMiklos Szeredi 		temp = ERR_PTR(-EIO);
46e9be9d5eSMiklos Szeredi 	}
47e9be9d5eSMiklos Szeredi 
48e9be9d5eSMiklos Szeredi 	return temp;
49e9be9d5eSMiklos Szeredi }
50e9be9d5eSMiklos Szeredi 
51e9be9d5eSMiklos Szeredi /* caller holds i_mutex on workdir */
52e9be9d5eSMiklos Szeredi static struct dentry *ovl_whiteout(struct dentry *workdir,
53e9be9d5eSMiklos Szeredi 				   struct dentry *dentry)
54e9be9d5eSMiklos Szeredi {
55e9be9d5eSMiklos Szeredi 	int err;
56e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
57e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
58e9be9d5eSMiklos Szeredi 
59e9be9d5eSMiklos Szeredi 	whiteout = ovl_lookup_temp(workdir, dentry);
60e9be9d5eSMiklos Szeredi 	if (IS_ERR(whiteout))
61e9be9d5eSMiklos Szeredi 		return whiteout;
62e9be9d5eSMiklos Szeredi 
63e9be9d5eSMiklos Szeredi 	err = ovl_do_whiteout(wdir, whiteout);
64e9be9d5eSMiklos Szeredi 	if (err) {
65e9be9d5eSMiklos Szeredi 		dput(whiteout);
66e9be9d5eSMiklos Szeredi 		whiteout = ERR_PTR(err);
67e9be9d5eSMiklos Szeredi 	}
68e9be9d5eSMiklos Szeredi 
69e9be9d5eSMiklos Szeredi 	return whiteout;
70e9be9d5eSMiklos Szeredi }
71e9be9d5eSMiklos Szeredi 
72e9be9d5eSMiklos Szeredi int ovl_create_real(struct inode *dir, struct dentry *newdentry,
73e9be9d5eSMiklos Szeredi 		    struct kstat *stat, const char *link,
74e9be9d5eSMiklos Szeredi 		    struct dentry *hardlink, bool debug)
75e9be9d5eSMiklos Szeredi {
76e9be9d5eSMiklos Szeredi 	int err;
77e9be9d5eSMiklos Szeredi 
78e9be9d5eSMiklos Szeredi 	if (newdentry->d_inode)
79e9be9d5eSMiklos Szeredi 		return -ESTALE;
80e9be9d5eSMiklos Szeredi 
81e9be9d5eSMiklos Szeredi 	if (hardlink) {
82e9be9d5eSMiklos Szeredi 		err = ovl_do_link(hardlink, dir, newdentry, debug);
83e9be9d5eSMiklos Szeredi 	} else {
84e9be9d5eSMiklos Szeredi 		switch (stat->mode & S_IFMT) {
85e9be9d5eSMiklos Szeredi 		case S_IFREG:
86e9be9d5eSMiklos Szeredi 			err = ovl_do_create(dir, newdentry, stat->mode, debug);
87e9be9d5eSMiklos Szeredi 			break;
88e9be9d5eSMiklos Szeredi 
89e9be9d5eSMiklos Szeredi 		case S_IFDIR:
90e9be9d5eSMiklos Szeredi 			err = ovl_do_mkdir(dir, newdentry, stat->mode, debug);
91e9be9d5eSMiklos Szeredi 			break;
92e9be9d5eSMiklos Szeredi 
93e9be9d5eSMiklos Szeredi 		case S_IFCHR:
94e9be9d5eSMiklos Szeredi 		case S_IFBLK:
95e9be9d5eSMiklos Szeredi 		case S_IFIFO:
96e9be9d5eSMiklos Szeredi 		case S_IFSOCK:
97e9be9d5eSMiklos Szeredi 			err = ovl_do_mknod(dir, newdentry,
98e9be9d5eSMiklos Szeredi 					   stat->mode, stat->rdev, debug);
99e9be9d5eSMiklos Szeredi 			break;
100e9be9d5eSMiklos Szeredi 
101e9be9d5eSMiklos Szeredi 		case S_IFLNK:
102e9be9d5eSMiklos Szeredi 			err = ovl_do_symlink(dir, newdentry, link, debug);
103e9be9d5eSMiklos Szeredi 			break;
104e9be9d5eSMiklos Szeredi 
105e9be9d5eSMiklos Szeredi 		default:
106e9be9d5eSMiklos Szeredi 			err = -EPERM;
107e9be9d5eSMiklos Szeredi 		}
108e9be9d5eSMiklos Szeredi 	}
109e9be9d5eSMiklos Szeredi 	if (!err && WARN_ON(!newdentry->d_inode)) {
110e9be9d5eSMiklos Szeredi 		/*
111e9be9d5eSMiklos Szeredi 		 * Not quite sure if non-instantiated dentry is legal or not.
112e9be9d5eSMiklos Szeredi 		 * VFS doesn't seem to care so check and warn here.
113e9be9d5eSMiklos Szeredi 		 */
114e9be9d5eSMiklos Szeredi 		err = -ENOENT;
115e9be9d5eSMiklos Szeredi 	}
116e9be9d5eSMiklos Szeredi 	return err;
117e9be9d5eSMiklos Szeredi }
118e9be9d5eSMiklos Szeredi 
119e9be9d5eSMiklos Szeredi static int ovl_set_opaque(struct dentry *upperdentry)
120e9be9d5eSMiklos Szeredi {
121e9be9d5eSMiklos Szeredi 	return ovl_do_setxattr(upperdentry, ovl_opaque_xattr, "y", 1, 0);
122e9be9d5eSMiklos Szeredi }
123e9be9d5eSMiklos Szeredi 
124e9be9d5eSMiklos Szeredi static void ovl_remove_opaque(struct dentry *upperdentry)
125e9be9d5eSMiklos Szeredi {
126e9be9d5eSMiklos Szeredi 	int err;
127e9be9d5eSMiklos Szeredi 
128e9be9d5eSMiklos Szeredi 	err = ovl_do_removexattr(upperdentry, ovl_opaque_xattr);
129e9be9d5eSMiklos Szeredi 	if (err) {
130e9be9d5eSMiklos Szeredi 		pr_warn("overlayfs: failed to remove opaque from '%s' (%i)\n",
131e9be9d5eSMiklos Szeredi 			upperdentry->d_name.name, err);
132e9be9d5eSMiklos Szeredi 	}
133e9be9d5eSMiklos Szeredi }
134e9be9d5eSMiklos Szeredi 
135e9be9d5eSMiklos Szeredi static int ovl_dir_getattr(struct vfsmount *mnt, struct dentry *dentry,
136e9be9d5eSMiklos Szeredi 			 struct kstat *stat)
137e9be9d5eSMiklos Szeredi {
138e9be9d5eSMiklos Szeredi 	int err;
139e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
140e9be9d5eSMiklos Szeredi 	struct path realpath;
141e9be9d5eSMiklos Szeredi 
142e9be9d5eSMiklos Szeredi 	type = ovl_path_real(dentry, &realpath);
143e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&realpath, stat);
144e9be9d5eSMiklos Szeredi 	if (err)
145e9be9d5eSMiklos Szeredi 		return err;
146e9be9d5eSMiklos Szeredi 
147e9be9d5eSMiklos Szeredi 	stat->dev = dentry->d_sb->s_dev;
148e9be9d5eSMiklos Szeredi 	stat->ino = dentry->d_inode->i_ino;
149e9be9d5eSMiklos Szeredi 
150e9be9d5eSMiklos Szeredi 	/*
151e9be9d5eSMiklos Szeredi 	 * It's probably not worth it to count subdirs to get the
152e9be9d5eSMiklos Szeredi 	 * correct link count.  nlink=1 seems to pacify 'find' and
153e9be9d5eSMiklos Szeredi 	 * other utilities.
154e9be9d5eSMiklos Szeredi 	 */
155e9be9d5eSMiklos Szeredi 	if (type == OVL_PATH_MERGE)
156e9be9d5eSMiklos Szeredi 		stat->nlink = 1;
157e9be9d5eSMiklos Szeredi 
158e9be9d5eSMiklos Szeredi 	return 0;
159e9be9d5eSMiklos Szeredi }
160e9be9d5eSMiklos Szeredi 
161e9be9d5eSMiklos Szeredi static int ovl_create_upper(struct dentry *dentry, struct inode *inode,
162e9be9d5eSMiklos Szeredi 			    struct kstat *stat, const char *link,
163e9be9d5eSMiklos Szeredi 			    struct dentry *hardlink)
164e9be9d5eSMiklos Szeredi {
165e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
166e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
167e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
168e9be9d5eSMiklos Szeredi 	int err;
169e9be9d5eSMiklos Szeredi 
170e9be9d5eSMiklos Szeredi 	mutex_lock_nested(&udir->i_mutex, I_MUTEX_PARENT);
171e9be9d5eSMiklos Szeredi 	newdentry = lookup_one_len(dentry->d_name.name, upperdir,
172e9be9d5eSMiklos Szeredi 				   dentry->d_name.len);
173e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
174e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
175e9be9d5eSMiklos Szeredi 		goto out_unlock;
176e9be9d5eSMiklos Szeredi 	err = ovl_create_real(udir, newdentry, stat, link, hardlink, false);
177e9be9d5eSMiklos Szeredi 	if (err)
178e9be9d5eSMiklos Szeredi 		goto out_dput;
179e9be9d5eSMiklos Szeredi 
180e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
181e9be9d5eSMiklos Szeredi 	ovl_dentry_update(dentry, newdentry);
182e9be9d5eSMiklos Szeredi 	ovl_copyattr(newdentry->d_inode, inode);
183e9be9d5eSMiklos Szeredi 	d_instantiate(dentry, inode);
184e9be9d5eSMiklos Szeredi 	newdentry = NULL;
185e9be9d5eSMiklos Szeredi out_dput:
186e9be9d5eSMiklos Szeredi 	dput(newdentry);
187e9be9d5eSMiklos Szeredi out_unlock:
188e9be9d5eSMiklos Szeredi 	mutex_unlock(&udir->i_mutex);
189e9be9d5eSMiklos Szeredi 	return err;
190e9be9d5eSMiklos Szeredi }
191e9be9d5eSMiklos Szeredi 
192e9be9d5eSMiklos Szeredi static int ovl_lock_rename_workdir(struct dentry *workdir,
193e9be9d5eSMiklos Szeredi 				   struct dentry *upperdir)
194e9be9d5eSMiklos Szeredi {
195e9be9d5eSMiklos Szeredi 	/* Workdir should not be the same as upperdir */
196e9be9d5eSMiklos Szeredi 	if (workdir == upperdir)
197e9be9d5eSMiklos Szeredi 		goto err;
198e9be9d5eSMiklos Szeredi 
199e9be9d5eSMiklos Szeredi 	/* Workdir should not be subdir of upperdir and vice versa */
200e9be9d5eSMiklos Szeredi 	if (lock_rename(workdir, upperdir) != NULL)
201e9be9d5eSMiklos Szeredi 		goto err_unlock;
202e9be9d5eSMiklos Szeredi 
203e9be9d5eSMiklos Szeredi 	return 0;
204e9be9d5eSMiklos Szeredi 
205e9be9d5eSMiklos Szeredi err_unlock:
206e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
207e9be9d5eSMiklos Szeredi err:
208e9be9d5eSMiklos Szeredi 	pr_err("overlayfs: failed to lock workdir+upperdir\n");
209e9be9d5eSMiklos Szeredi 	return -EIO;
210e9be9d5eSMiklos Szeredi }
211e9be9d5eSMiklos Szeredi 
212e9be9d5eSMiklos Szeredi static struct dentry *ovl_clear_empty(struct dentry *dentry,
213e9be9d5eSMiklos Szeredi 				      struct list_head *list)
214e9be9d5eSMiklos Szeredi {
215e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
216e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
217e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
218e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
219e9be9d5eSMiklos Szeredi 	struct path upperpath;
220e9be9d5eSMiklos Szeredi 	struct dentry *upper;
221e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir;
222e9be9d5eSMiklos Szeredi 	struct kstat stat;
223e9be9d5eSMiklos Szeredi 	int err;
224e9be9d5eSMiklos Szeredi 
225e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
226e9be9d5eSMiklos Szeredi 	if (err)
227e9be9d5eSMiklos Szeredi 		goto out;
228e9be9d5eSMiklos Szeredi 
229e9be9d5eSMiklos Szeredi 	ovl_path_upper(dentry, &upperpath);
230e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&upperpath, &stat);
231e9be9d5eSMiklos Szeredi 	if (err)
232e9be9d5eSMiklos Szeredi 		goto out_unlock;
233e9be9d5eSMiklos Szeredi 
234e9be9d5eSMiklos Szeredi 	err = -ESTALE;
235e9be9d5eSMiklos Szeredi 	if (!S_ISDIR(stat.mode))
236e9be9d5eSMiklos Szeredi 		goto out_unlock;
237e9be9d5eSMiklos Szeredi 	upper = upperpath.dentry;
238e9be9d5eSMiklos Szeredi 	if (upper->d_parent->d_inode != udir)
239e9be9d5eSMiklos Szeredi 		goto out_unlock;
240e9be9d5eSMiklos Szeredi 
241e9be9d5eSMiklos Szeredi 	opaquedir = ovl_lookup_temp(workdir, dentry);
242e9be9d5eSMiklos Szeredi 	err = PTR_ERR(opaquedir);
243e9be9d5eSMiklos Szeredi 	if (IS_ERR(opaquedir))
244e9be9d5eSMiklos Szeredi 		goto out_unlock;
245e9be9d5eSMiklos Szeredi 
246e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, opaquedir, &stat, NULL, NULL, true);
247e9be9d5eSMiklos Szeredi 	if (err)
248e9be9d5eSMiklos Szeredi 		goto out_dput;
249e9be9d5eSMiklos Szeredi 
250e9be9d5eSMiklos Szeredi 	err = ovl_copy_xattr(upper, opaquedir);
251e9be9d5eSMiklos Szeredi 	if (err)
252e9be9d5eSMiklos Szeredi 		goto out_cleanup;
253e9be9d5eSMiklos Szeredi 
254e9be9d5eSMiklos Szeredi 	err = ovl_set_opaque(opaquedir);
255e9be9d5eSMiklos Szeredi 	if (err)
256e9be9d5eSMiklos Szeredi 		goto out_cleanup;
257e9be9d5eSMiklos Szeredi 
258e9be9d5eSMiklos Szeredi 	mutex_lock(&opaquedir->d_inode->i_mutex);
259e9be9d5eSMiklos Szeredi 	err = ovl_set_attr(opaquedir, &stat);
260e9be9d5eSMiklos Szeredi 	mutex_unlock(&opaquedir->d_inode->i_mutex);
261e9be9d5eSMiklos Szeredi 	if (err)
262e9be9d5eSMiklos Szeredi 		goto out_cleanup;
263e9be9d5eSMiklos Szeredi 
264e9be9d5eSMiklos Szeredi 	err = ovl_do_rename(wdir, opaquedir, udir, upper, RENAME_EXCHANGE);
265e9be9d5eSMiklos Szeredi 	if (err)
266e9be9d5eSMiklos Szeredi 		goto out_cleanup;
267e9be9d5eSMiklos Szeredi 
268e9be9d5eSMiklos Szeredi 	ovl_cleanup_whiteouts(upper, list);
269e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, upper);
270e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
271e9be9d5eSMiklos Szeredi 
272e9be9d5eSMiklos Szeredi 	/* dentry's upper doesn't match now, get rid of it */
273e9be9d5eSMiklos Szeredi 	d_drop(dentry);
274e9be9d5eSMiklos Szeredi 
275e9be9d5eSMiklos Szeredi 	return opaquedir;
276e9be9d5eSMiklos Szeredi 
277e9be9d5eSMiklos Szeredi out_cleanup:
278e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, opaquedir);
279e9be9d5eSMiklos Szeredi out_dput:
280e9be9d5eSMiklos Szeredi 	dput(opaquedir);
281e9be9d5eSMiklos Szeredi out_unlock:
282e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
283e9be9d5eSMiklos Szeredi out:
284e9be9d5eSMiklos Szeredi 	return ERR_PTR(err);
285e9be9d5eSMiklos Szeredi }
286e9be9d5eSMiklos Szeredi 
287a105d685SMiklos Szeredi static struct dentry *ovl_check_empty_and_clear(struct dentry *dentry)
288e9be9d5eSMiklos Szeredi {
289e9be9d5eSMiklos Szeredi 	int err;
290e9be9d5eSMiklos Szeredi 	struct dentry *ret = NULL;
291e9be9d5eSMiklos Szeredi 	LIST_HEAD(list);
292e9be9d5eSMiklos Szeredi 
293e9be9d5eSMiklos Szeredi 	err = ovl_check_empty_dir(dentry, &list);
294e9be9d5eSMiklos Szeredi 	if (err)
295e9be9d5eSMiklos Szeredi 		ret = ERR_PTR(err);
296a105d685SMiklos Szeredi 	else {
297a105d685SMiklos Szeredi 		/*
298a105d685SMiklos Szeredi 		 * If no upperdentry then skip clearing whiteouts.
299a105d685SMiklos Szeredi 		 *
300a105d685SMiklos Szeredi 		 * Can race with copy-up, since we don't hold the upperdir
301a105d685SMiklos Szeredi 		 * mutex.  Doesn't matter, since copy-up can't create a
302a105d685SMiklos Szeredi 		 * non-empty directory from an empty one.
303a105d685SMiklos Szeredi 		 */
304a105d685SMiklos Szeredi 		if (ovl_dentry_upper(dentry))
305e9be9d5eSMiklos Szeredi 			ret = ovl_clear_empty(dentry, &list);
306a105d685SMiklos Szeredi 	}
307e9be9d5eSMiklos Szeredi 
308e9be9d5eSMiklos Szeredi 	ovl_cache_free(&list);
309e9be9d5eSMiklos Szeredi 
310e9be9d5eSMiklos Szeredi 	return ret;
311e9be9d5eSMiklos Szeredi }
312e9be9d5eSMiklos Szeredi 
313e9be9d5eSMiklos Szeredi static int ovl_create_over_whiteout(struct dentry *dentry, struct inode *inode,
314e9be9d5eSMiklos Szeredi 				    struct kstat *stat, const char *link,
315e9be9d5eSMiklos Szeredi 				    struct dentry *hardlink)
316e9be9d5eSMiklos Szeredi {
317e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
318e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
319e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
320e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
321e9be9d5eSMiklos Szeredi 	struct dentry *upper;
322e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
323e9be9d5eSMiklos Szeredi 	int err;
324e9be9d5eSMiklos Szeredi 
325e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
326e9be9d5eSMiklos Szeredi 	if (err)
327e9be9d5eSMiklos Szeredi 		goto out;
328e9be9d5eSMiklos Szeredi 
329e9be9d5eSMiklos Szeredi 	newdentry = ovl_lookup_temp(workdir, dentry);
330e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
331e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
332e9be9d5eSMiklos Szeredi 		goto out_unlock;
333e9be9d5eSMiklos Szeredi 
334e9be9d5eSMiklos Szeredi 	upper = lookup_one_len(dentry->d_name.name, upperdir,
335e9be9d5eSMiklos Szeredi 			       dentry->d_name.len);
336e9be9d5eSMiklos Szeredi 	err = PTR_ERR(upper);
337e9be9d5eSMiklos Szeredi 	if (IS_ERR(upper))
338e9be9d5eSMiklos Szeredi 		goto out_dput;
339e9be9d5eSMiklos Szeredi 
340e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, newdentry, stat, link, hardlink, true);
341e9be9d5eSMiklos Szeredi 	if (err)
342e9be9d5eSMiklos Szeredi 		goto out_dput2;
343e9be9d5eSMiklos Szeredi 
344e9be9d5eSMiklos Szeredi 	if (S_ISDIR(stat->mode)) {
345e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
346e9be9d5eSMiklos Szeredi 		if (err)
347e9be9d5eSMiklos Szeredi 			goto out_cleanup;
348e9be9d5eSMiklos Szeredi 
349e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper,
350e9be9d5eSMiklos Szeredi 				    RENAME_EXCHANGE);
351e9be9d5eSMiklos Szeredi 		if (err)
352e9be9d5eSMiklos Szeredi 			goto out_cleanup;
353e9be9d5eSMiklos Szeredi 
354e9be9d5eSMiklos Szeredi 		ovl_cleanup(wdir, upper);
355e9be9d5eSMiklos Szeredi 	} else {
356e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper, 0);
357e9be9d5eSMiklos Szeredi 		if (err)
358e9be9d5eSMiklos Szeredi 			goto out_cleanup;
359e9be9d5eSMiklos Szeredi 	}
360e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
361e9be9d5eSMiklos Szeredi 	ovl_dentry_update(dentry, newdentry);
362e9be9d5eSMiklos Szeredi 	ovl_copyattr(newdentry->d_inode, inode);
363e9be9d5eSMiklos Szeredi 	d_instantiate(dentry, inode);
364e9be9d5eSMiklos Szeredi 	newdentry = NULL;
365e9be9d5eSMiklos Szeredi out_dput2:
366e9be9d5eSMiklos Szeredi 	dput(upper);
367e9be9d5eSMiklos Szeredi out_dput:
368e9be9d5eSMiklos Szeredi 	dput(newdentry);
369e9be9d5eSMiklos Szeredi out_unlock:
370e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
371e9be9d5eSMiklos Szeredi out:
372e9be9d5eSMiklos Szeredi 	return err;
373e9be9d5eSMiklos Szeredi 
374e9be9d5eSMiklos Szeredi out_cleanup:
375e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, newdentry);
376e9be9d5eSMiklos Szeredi 	goto out_dput2;
377e9be9d5eSMiklos Szeredi }
378e9be9d5eSMiklos Szeredi 
379e9be9d5eSMiklos Szeredi static int ovl_create_or_link(struct dentry *dentry, int mode, dev_t rdev,
380e9be9d5eSMiklos Szeredi 			      const char *link, struct dentry *hardlink)
381e9be9d5eSMiklos Szeredi {
382e9be9d5eSMiklos Szeredi 	int err;
383e9be9d5eSMiklos Szeredi 	struct inode *inode;
384e9be9d5eSMiklos Szeredi 	struct kstat stat = {
385e9be9d5eSMiklos Szeredi 		.mode = mode,
386e9be9d5eSMiklos Szeredi 		.rdev = rdev,
387e9be9d5eSMiklos Szeredi 	};
388e9be9d5eSMiklos Szeredi 
389e9be9d5eSMiklos Szeredi 	err = -ENOMEM;
390e9be9d5eSMiklos Szeredi 	inode = ovl_new_inode(dentry->d_sb, mode, dentry->d_fsdata);
391e9be9d5eSMiklos Szeredi 	if (!inode)
392e9be9d5eSMiklos Szeredi 		goto out;
393e9be9d5eSMiklos Szeredi 
394e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
395e9be9d5eSMiklos Szeredi 	if (err)
396e9be9d5eSMiklos Szeredi 		goto out_iput;
397e9be9d5eSMiklos Szeredi 
398e9be9d5eSMiklos Szeredi 	if (!ovl_dentry_is_opaque(dentry)) {
399e9be9d5eSMiklos Szeredi 		err = ovl_create_upper(dentry, inode, &stat, link, hardlink);
400e9be9d5eSMiklos Szeredi 	} else {
401e9be9d5eSMiklos Szeredi 		const struct cred *old_cred;
402e9be9d5eSMiklos Szeredi 		struct cred *override_cred;
403e9be9d5eSMiklos Szeredi 
404e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
405e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
406e9be9d5eSMiklos Szeredi 		if (!override_cred)
407e9be9d5eSMiklos Szeredi 			goto out_iput;
408e9be9d5eSMiklos Szeredi 
409e9be9d5eSMiklos Szeredi 		/*
410e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting opaque xattr
411e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir, rename
412e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
413e9be9d5eSMiklos Szeredi 		 */
414e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
415e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
416e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
417e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
418e9be9d5eSMiklos Szeredi 
419e9be9d5eSMiklos Szeredi 		err = ovl_create_over_whiteout(dentry, inode, &stat, link,
420e9be9d5eSMiklos Szeredi 					       hardlink);
421e9be9d5eSMiklos Szeredi 
422e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
423e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
424e9be9d5eSMiklos Szeredi 	}
425e9be9d5eSMiklos Szeredi 
426e9be9d5eSMiklos Szeredi 	if (!err)
427e9be9d5eSMiklos Szeredi 		inode = NULL;
428e9be9d5eSMiklos Szeredi out_iput:
429e9be9d5eSMiklos Szeredi 	iput(inode);
430e9be9d5eSMiklos Szeredi out:
431e9be9d5eSMiklos Szeredi 	return err;
432e9be9d5eSMiklos Szeredi }
433e9be9d5eSMiklos Szeredi 
434e9be9d5eSMiklos Szeredi static int ovl_create_object(struct dentry *dentry, int mode, dev_t rdev,
435e9be9d5eSMiklos Szeredi 			     const char *link)
436e9be9d5eSMiklos Szeredi {
437e9be9d5eSMiklos Szeredi 	int err;
438e9be9d5eSMiklos Szeredi 
439e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
440e9be9d5eSMiklos Szeredi 	if (!err) {
441e9be9d5eSMiklos Szeredi 		err = ovl_create_or_link(dentry, mode, rdev, link, NULL);
442e9be9d5eSMiklos Szeredi 		ovl_drop_write(dentry);
443e9be9d5eSMiklos Szeredi 	}
444e9be9d5eSMiklos Szeredi 
445e9be9d5eSMiklos Szeredi 	return err;
446e9be9d5eSMiklos Szeredi }
447e9be9d5eSMiklos Szeredi 
448e9be9d5eSMiklos Szeredi static int ovl_create(struct inode *dir, struct dentry *dentry, umode_t mode,
449e9be9d5eSMiklos Szeredi 		      bool excl)
450e9be9d5eSMiklos Szeredi {
451e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFREG, 0, NULL);
452e9be9d5eSMiklos Szeredi }
453e9be9d5eSMiklos Szeredi 
454e9be9d5eSMiklos Szeredi static int ovl_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode)
455e9be9d5eSMiklos Szeredi {
456e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFDIR, 0, NULL);
457e9be9d5eSMiklos Szeredi }
458e9be9d5eSMiklos Szeredi 
459e9be9d5eSMiklos Szeredi static int ovl_mknod(struct inode *dir, struct dentry *dentry, umode_t mode,
460e9be9d5eSMiklos Szeredi 		     dev_t rdev)
461e9be9d5eSMiklos Szeredi {
462e9be9d5eSMiklos Szeredi 	/* Don't allow creation of "whiteout" on overlay */
463e9be9d5eSMiklos Szeredi 	if (S_ISCHR(mode) && rdev == WHITEOUT_DEV)
464e9be9d5eSMiklos Szeredi 		return -EPERM;
465e9be9d5eSMiklos Szeredi 
466e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, mode, rdev, NULL);
467e9be9d5eSMiklos Szeredi }
468e9be9d5eSMiklos Szeredi 
469e9be9d5eSMiklos Szeredi static int ovl_symlink(struct inode *dir, struct dentry *dentry,
470e9be9d5eSMiklos Szeredi 		       const char *link)
471e9be9d5eSMiklos Szeredi {
472e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, S_IFLNK, 0, link);
473e9be9d5eSMiklos Szeredi }
474e9be9d5eSMiklos Szeredi 
475e9be9d5eSMiklos Szeredi static int ovl_link(struct dentry *old, struct inode *newdir,
476e9be9d5eSMiklos Szeredi 		    struct dentry *new)
477e9be9d5eSMiklos Szeredi {
478e9be9d5eSMiklos Szeredi 	int err;
479e9be9d5eSMiklos Szeredi 	struct dentry *upper;
480e9be9d5eSMiklos Szeredi 
481e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
482e9be9d5eSMiklos Szeredi 	if (err)
483e9be9d5eSMiklos Szeredi 		goto out;
484e9be9d5eSMiklos Szeredi 
485e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
486e9be9d5eSMiklos Szeredi 	if (err)
487e9be9d5eSMiklos Szeredi 		goto out_drop_write;
488e9be9d5eSMiklos Szeredi 
489e9be9d5eSMiklos Szeredi 	upper = ovl_dentry_upper(old);
490e9be9d5eSMiklos Szeredi 	err = ovl_create_or_link(new, upper->d_inode->i_mode, 0, NULL, upper);
491e9be9d5eSMiklos Szeredi 
492e9be9d5eSMiklos Szeredi out_drop_write:
493e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
494e9be9d5eSMiklos Szeredi out:
495e9be9d5eSMiklos Szeredi 	return err;
496e9be9d5eSMiklos Szeredi }
497e9be9d5eSMiklos Szeredi 
498a105d685SMiklos Szeredi static int ovl_remove_and_whiteout(struct dentry *dentry, bool is_dir)
499e9be9d5eSMiklos Szeredi {
500e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
501e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
502e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
503e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
504e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
505e9be9d5eSMiklos Szeredi 	struct dentry *upper;
506e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
507e9be9d5eSMiklos Szeredi 	int err;
508e9be9d5eSMiklos Szeredi 
509e9be9d5eSMiklos Szeredi 	if (is_dir) {
510a105d685SMiklos Szeredi 		opaquedir = ovl_check_empty_and_clear(dentry);
511e9be9d5eSMiklos Szeredi 		err = PTR_ERR(opaquedir);
512e9be9d5eSMiklos Szeredi 		if (IS_ERR(opaquedir))
513e9be9d5eSMiklos Szeredi 			goto out;
514e9be9d5eSMiklos Szeredi 	}
515e9be9d5eSMiklos Szeredi 
516e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
517e9be9d5eSMiklos Szeredi 	if (err)
518e9be9d5eSMiklos Szeredi 		goto out_dput;
519e9be9d5eSMiklos Szeredi 
520e9be9d5eSMiklos Szeredi 	whiteout = ovl_whiteout(workdir, dentry);
521e9be9d5eSMiklos Szeredi 	err = PTR_ERR(whiteout);
522e9be9d5eSMiklos Szeredi 	if (IS_ERR(whiteout))
523e9be9d5eSMiklos Szeredi 		goto out_unlock;
524e9be9d5eSMiklos Szeredi 
525a105d685SMiklos Szeredi 	upper = ovl_dentry_upper(dentry);
526a105d685SMiklos Szeredi 	if (!upper) {
527e9be9d5eSMiklos Szeredi 		upper = lookup_one_len(dentry->d_name.name, upperdir,
528e9be9d5eSMiklos Szeredi 				       dentry->d_name.len);
529e9be9d5eSMiklos Szeredi 		err = PTR_ERR(upper);
530e9be9d5eSMiklos Szeredi 		if (IS_ERR(upper))
531e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
532e9be9d5eSMiklos Szeredi 
533e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, whiteout, udir, upper, 0);
534e9be9d5eSMiklos Szeredi 		dput(upper);
535e9be9d5eSMiklos Szeredi 		if (err)
536e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
537e9be9d5eSMiklos Szeredi 	} else {
538e9be9d5eSMiklos Szeredi 		int flags = 0;
539e9be9d5eSMiklos Szeredi 
540e9be9d5eSMiklos Szeredi 		if (opaquedir)
541e9be9d5eSMiklos Szeredi 			upper = opaquedir;
542e9be9d5eSMiklos Szeredi 		err = -ESTALE;
543e9be9d5eSMiklos Szeredi 		if (upper->d_parent != upperdir)
544e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
545e9be9d5eSMiklos Szeredi 
546e9be9d5eSMiklos Szeredi 		if (is_dir)
547e9be9d5eSMiklos Szeredi 			flags |= RENAME_EXCHANGE;
548e9be9d5eSMiklos Szeredi 
549e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, whiteout, udir, upper, flags);
550e9be9d5eSMiklos Szeredi 		if (err)
551e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
552e9be9d5eSMiklos Szeredi 
553e9be9d5eSMiklos Szeredi 		if (is_dir)
554e9be9d5eSMiklos Szeredi 			ovl_cleanup(wdir, upper);
555e9be9d5eSMiklos Szeredi 	}
556e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
557e9be9d5eSMiklos Szeredi out_d_drop:
558e9be9d5eSMiklos Szeredi 	d_drop(dentry);
559e9be9d5eSMiklos Szeredi 	dput(whiteout);
560e9be9d5eSMiklos Szeredi out_unlock:
561e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
562e9be9d5eSMiklos Szeredi out_dput:
563e9be9d5eSMiklos Szeredi 	dput(opaquedir);
564e9be9d5eSMiklos Szeredi out:
565e9be9d5eSMiklos Szeredi 	return err;
566e9be9d5eSMiklos Szeredi 
567e9be9d5eSMiklos Szeredi kill_whiteout:
568e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, whiteout);
569e9be9d5eSMiklos Szeredi 	goto out_d_drop;
570e9be9d5eSMiklos Szeredi }
571e9be9d5eSMiklos Szeredi 
572e9be9d5eSMiklos Szeredi static int ovl_remove_upper(struct dentry *dentry, bool is_dir)
573e9be9d5eSMiklos Szeredi {
574e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
575e9be9d5eSMiklos Szeredi 	struct inode *dir = upperdir->d_inode;
576e9be9d5eSMiklos Szeredi 	struct dentry *upper = ovl_dentry_upper(dentry);
577e9be9d5eSMiklos Szeredi 	int err;
578e9be9d5eSMiklos Szeredi 
579e9be9d5eSMiklos Szeredi 	mutex_lock_nested(&dir->i_mutex, I_MUTEX_PARENT);
580e9be9d5eSMiklos Szeredi 	err = -ESTALE;
581e9be9d5eSMiklos Szeredi 	if (upper->d_parent == upperdir) {
582e9be9d5eSMiklos Szeredi 		/* Don't let d_delete() think it can reset d_inode */
583e9be9d5eSMiklos Szeredi 		dget(upper);
584e9be9d5eSMiklos Szeredi 		if (is_dir)
585e9be9d5eSMiklos Szeredi 			err = vfs_rmdir(dir, upper);
586e9be9d5eSMiklos Szeredi 		else
587e9be9d5eSMiklos Szeredi 			err = vfs_unlink(dir, upper, NULL);
588e9be9d5eSMiklos Szeredi 		dput(upper);
589e9be9d5eSMiklos Szeredi 		ovl_dentry_version_inc(dentry->d_parent);
590e9be9d5eSMiklos Szeredi 	}
591e9be9d5eSMiklos Szeredi 
592e9be9d5eSMiklos Szeredi 	/*
593e9be9d5eSMiklos Szeredi 	 * Keeping this dentry hashed would mean having to release
594e9be9d5eSMiklos Szeredi 	 * upperpath/lowerpath, which could only be done if we are the
595e9be9d5eSMiklos Szeredi 	 * sole user of this dentry.  Too tricky...  Just unhash for
596e9be9d5eSMiklos Szeredi 	 * now.
597e9be9d5eSMiklos Szeredi 	 */
598e9be9d5eSMiklos Szeredi 	d_drop(dentry);
599e9be9d5eSMiklos Szeredi 	mutex_unlock(&dir->i_mutex);
600e9be9d5eSMiklos Szeredi 
601e9be9d5eSMiklos Szeredi 	return err;
602e9be9d5eSMiklos Szeredi }
603e9be9d5eSMiklos Szeredi 
604e9be9d5eSMiklos Szeredi static inline int ovl_check_sticky(struct dentry *dentry)
605e9be9d5eSMiklos Szeredi {
606e9be9d5eSMiklos Szeredi 	struct inode *dir = ovl_dentry_real(dentry->d_parent)->d_inode;
607e9be9d5eSMiklos Szeredi 	struct inode *inode = ovl_dentry_real(dentry)->d_inode;
608e9be9d5eSMiklos Szeredi 
609e9be9d5eSMiklos Szeredi 	if (check_sticky(dir, inode))
610e9be9d5eSMiklos Szeredi 		return -EPERM;
611e9be9d5eSMiklos Szeredi 
612e9be9d5eSMiklos Szeredi 	return 0;
613e9be9d5eSMiklos Szeredi }
614e9be9d5eSMiklos Szeredi 
615e9be9d5eSMiklos Szeredi static int ovl_do_remove(struct dentry *dentry, bool is_dir)
616e9be9d5eSMiklos Szeredi {
617e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
618e9be9d5eSMiklos Szeredi 	int err;
619e9be9d5eSMiklos Szeredi 
620e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(dentry);
621e9be9d5eSMiklos Szeredi 	if (err)
622e9be9d5eSMiklos Szeredi 		goto out;
623e9be9d5eSMiklos Szeredi 
624e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
625e9be9d5eSMiklos Szeredi 	if (err)
626e9be9d5eSMiklos Szeredi 		goto out;
627e9be9d5eSMiklos Szeredi 
628e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
629e9be9d5eSMiklos Szeredi 	if (err)
630e9be9d5eSMiklos Szeredi 		goto out_drop_write;
631e9be9d5eSMiklos Szeredi 
632e9be9d5eSMiklos Szeredi 	type = ovl_path_type(dentry);
633e9be9d5eSMiklos Szeredi 	if (type == OVL_PATH_PURE_UPPER) {
634e9be9d5eSMiklos Szeredi 		err = ovl_remove_upper(dentry, is_dir);
635e9be9d5eSMiklos Szeredi 	} else {
636e9be9d5eSMiklos Szeredi 		const struct cred *old_cred;
637e9be9d5eSMiklos Szeredi 		struct cred *override_cred;
638e9be9d5eSMiklos Szeredi 
639e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
640e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
641e9be9d5eSMiklos Szeredi 		if (!override_cred)
642e9be9d5eSMiklos Szeredi 			goto out_drop_write;
643e9be9d5eSMiklos Szeredi 
644e9be9d5eSMiklos Szeredi 		/*
645e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting xattr on whiteout, opaque dir
646e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir, rename
647e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
648e9be9d5eSMiklos Szeredi 		 * CAP_FSETID for chmod of opaque dir
649e9be9d5eSMiklos Szeredi 		 * CAP_CHOWN for chown of opaque dir
650e9be9d5eSMiklos Szeredi 		 */
651e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
652e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
653e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
654e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FSETID);
655e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_CHOWN);
656e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
657e9be9d5eSMiklos Szeredi 
658a105d685SMiklos Szeredi 		err = ovl_remove_and_whiteout(dentry, is_dir);
659e9be9d5eSMiklos Szeredi 
660e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
661e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
662e9be9d5eSMiklos Szeredi 	}
663e9be9d5eSMiklos Szeredi out_drop_write:
664e9be9d5eSMiklos Szeredi 	ovl_drop_write(dentry);
665e9be9d5eSMiklos Szeredi out:
666e9be9d5eSMiklos Szeredi 	return err;
667e9be9d5eSMiklos Szeredi }
668e9be9d5eSMiklos Szeredi 
669e9be9d5eSMiklos Szeredi static int ovl_unlink(struct inode *dir, struct dentry *dentry)
670e9be9d5eSMiklos Szeredi {
671e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, false);
672e9be9d5eSMiklos Szeredi }
673e9be9d5eSMiklos Szeredi 
674e9be9d5eSMiklos Szeredi static int ovl_rmdir(struct inode *dir, struct dentry *dentry)
675e9be9d5eSMiklos Szeredi {
676e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, true);
677e9be9d5eSMiklos Szeredi }
678e9be9d5eSMiklos Szeredi 
679e9be9d5eSMiklos Szeredi static int ovl_rename2(struct inode *olddir, struct dentry *old,
680e9be9d5eSMiklos Szeredi 		       struct inode *newdir, struct dentry *new,
681e9be9d5eSMiklos Szeredi 		       unsigned int flags)
682e9be9d5eSMiklos Szeredi {
683e9be9d5eSMiklos Szeredi 	int err;
684e9be9d5eSMiklos Szeredi 	enum ovl_path_type old_type;
685e9be9d5eSMiklos Szeredi 	enum ovl_path_type new_type;
686e9be9d5eSMiklos Szeredi 	struct dentry *old_upperdir;
687e9be9d5eSMiklos Szeredi 	struct dentry *new_upperdir;
688e9be9d5eSMiklos Szeredi 	struct dentry *olddentry;
689e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
690e9be9d5eSMiklos Szeredi 	struct dentry *trap;
691e9be9d5eSMiklos Szeredi 	bool old_opaque;
692e9be9d5eSMiklos Szeredi 	bool new_opaque;
693e9be9d5eSMiklos Szeredi 	bool new_create = false;
694e9be9d5eSMiklos Szeredi 	bool cleanup_whiteout = false;
695e9be9d5eSMiklos Szeredi 	bool overwrite = !(flags & RENAME_EXCHANGE);
696e9be9d5eSMiklos Szeredi 	bool is_dir = S_ISDIR(old->d_inode->i_mode);
697e9be9d5eSMiklos Szeredi 	bool new_is_dir = false;
698e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
699e9be9d5eSMiklos Szeredi 	const struct cred *old_cred = NULL;
700e9be9d5eSMiklos Szeredi 	struct cred *override_cred = NULL;
701e9be9d5eSMiklos Szeredi 
702e9be9d5eSMiklos Szeredi 	err = -EINVAL;
703e9be9d5eSMiklos Szeredi 	if (flags & ~(RENAME_EXCHANGE | RENAME_NOREPLACE))
704e9be9d5eSMiklos Szeredi 		goto out;
705e9be9d5eSMiklos Szeredi 
706e9be9d5eSMiklos Szeredi 	flags &= ~RENAME_NOREPLACE;
707e9be9d5eSMiklos Szeredi 
708e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(old);
709e9be9d5eSMiklos Szeredi 	if (err)
710e9be9d5eSMiklos Szeredi 		goto out;
711e9be9d5eSMiklos Szeredi 
712e9be9d5eSMiklos Szeredi 	/* Don't copy up directory trees */
713e9be9d5eSMiklos Szeredi 	old_type = ovl_path_type(old);
714e9be9d5eSMiklos Szeredi 	err = -EXDEV;
715e9be9d5eSMiklos Szeredi 	if ((old_type == OVL_PATH_LOWER || old_type == OVL_PATH_MERGE) && is_dir)
716e9be9d5eSMiklos Szeredi 		goto out;
717e9be9d5eSMiklos Szeredi 
718e9be9d5eSMiklos Szeredi 	if (new->d_inode) {
719e9be9d5eSMiklos Szeredi 		err = ovl_check_sticky(new);
720e9be9d5eSMiklos Szeredi 		if (err)
721e9be9d5eSMiklos Szeredi 			goto out;
722e9be9d5eSMiklos Szeredi 
723e9be9d5eSMiklos Szeredi 		if (S_ISDIR(new->d_inode->i_mode))
724e9be9d5eSMiklos Szeredi 			new_is_dir = true;
725e9be9d5eSMiklos Szeredi 
726e9be9d5eSMiklos Szeredi 		new_type = ovl_path_type(new);
727e9be9d5eSMiklos Szeredi 		err = -EXDEV;
728e9be9d5eSMiklos Szeredi 		if (!overwrite && (new_type == OVL_PATH_LOWER || new_type == OVL_PATH_MERGE) && new_is_dir)
729e9be9d5eSMiklos Szeredi 			goto out;
730e9be9d5eSMiklos Szeredi 
731e9be9d5eSMiklos Szeredi 		err = 0;
732e9be9d5eSMiklos Szeredi 		if (new_type == OVL_PATH_LOWER && old_type == OVL_PATH_LOWER) {
733e9be9d5eSMiklos Szeredi 			if (ovl_dentry_lower(old)->d_inode ==
734e9be9d5eSMiklos Szeredi 			    ovl_dentry_lower(new)->d_inode)
735e9be9d5eSMiklos Szeredi 				goto out;
736e9be9d5eSMiklos Szeredi 		}
737e9be9d5eSMiklos Szeredi 		if (new_type != OVL_PATH_LOWER && old_type != OVL_PATH_LOWER) {
738e9be9d5eSMiklos Szeredi 			if (ovl_dentry_upper(old)->d_inode ==
739e9be9d5eSMiklos Szeredi 			    ovl_dentry_upper(new)->d_inode)
740e9be9d5eSMiklos Szeredi 				goto out;
741e9be9d5eSMiklos Szeredi 		}
742e9be9d5eSMiklos Szeredi 	} else {
743e9be9d5eSMiklos Szeredi 		if (ovl_dentry_is_opaque(new))
744e9be9d5eSMiklos Szeredi 			new_type = OVL_PATH_UPPER;
745e9be9d5eSMiklos Szeredi 		else
746e9be9d5eSMiklos Szeredi 			new_type = OVL_PATH_PURE_UPPER;
747e9be9d5eSMiklos Szeredi 	}
748e9be9d5eSMiklos Szeredi 
749e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
750e9be9d5eSMiklos Szeredi 	if (err)
751e9be9d5eSMiklos Szeredi 		goto out;
752e9be9d5eSMiklos Szeredi 
753e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
754e9be9d5eSMiklos Szeredi 	if (err)
755e9be9d5eSMiklos Szeredi 		goto out_drop_write;
756e9be9d5eSMiklos Szeredi 
757e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(new->d_parent);
758e9be9d5eSMiklos Szeredi 	if (err)
759e9be9d5eSMiklos Szeredi 		goto out_drop_write;
760e9be9d5eSMiklos Szeredi 	if (!overwrite) {
761e9be9d5eSMiklos Szeredi 		err = ovl_copy_up(new);
762e9be9d5eSMiklos Szeredi 		if (err)
763e9be9d5eSMiklos Szeredi 			goto out_drop_write;
764e9be9d5eSMiklos Szeredi 	}
765e9be9d5eSMiklos Szeredi 
766e9be9d5eSMiklos Szeredi 	old_opaque = old_type != OVL_PATH_PURE_UPPER;
767e9be9d5eSMiklos Szeredi 	new_opaque = new_type != OVL_PATH_PURE_UPPER;
768e9be9d5eSMiklos Szeredi 
769e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
770e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
771e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
772e9be9d5eSMiklos Szeredi 		if (!override_cred)
773e9be9d5eSMiklos Szeredi 			goto out_drop_write;
774e9be9d5eSMiklos Szeredi 
775e9be9d5eSMiklos Szeredi 		/*
776e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting xattr on whiteout, opaque dir
777e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir
778e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
779e9be9d5eSMiklos Szeredi 		 * CAP_FSETID for chmod of opaque dir
780e9be9d5eSMiklos Szeredi 		 * CAP_CHOWN for chown of opaque dir
781e9be9d5eSMiklos Szeredi 		 */
782e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
783e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
784e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
785e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FSETID);
786e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_CHOWN);
787e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
788e9be9d5eSMiklos Szeredi 	}
789e9be9d5eSMiklos Szeredi 
790e9be9d5eSMiklos Szeredi 	if (overwrite && (new_type == OVL_PATH_LOWER || new_type == OVL_PATH_MERGE) && new_is_dir) {
791a105d685SMiklos Szeredi 		opaquedir = ovl_check_empty_and_clear(new);
792e9be9d5eSMiklos Szeredi 		err = PTR_ERR(opaquedir);
793e9be9d5eSMiklos Szeredi 		if (IS_ERR(opaquedir)) {
794e9be9d5eSMiklos Szeredi 			opaquedir = NULL;
795e9be9d5eSMiklos Szeredi 			goto out_revert_creds;
796e9be9d5eSMiklos Szeredi 		}
797e9be9d5eSMiklos Szeredi 	}
798e9be9d5eSMiklos Szeredi 
799e9be9d5eSMiklos Szeredi 	if (overwrite) {
800e9be9d5eSMiklos Szeredi 		if (old_opaque) {
801e9be9d5eSMiklos Szeredi 			if (new->d_inode || !new_opaque) {
802e9be9d5eSMiklos Szeredi 				/* Whiteout source */
803e9be9d5eSMiklos Szeredi 				flags |= RENAME_WHITEOUT;
804e9be9d5eSMiklos Szeredi 			} else {
805e9be9d5eSMiklos Szeredi 				/* Switch whiteouts */
806e9be9d5eSMiklos Szeredi 				flags |= RENAME_EXCHANGE;
807e9be9d5eSMiklos Szeredi 			}
808e9be9d5eSMiklos Szeredi 		} else if (is_dir && !new->d_inode && new_opaque) {
809e9be9d5eSMiklos Szeredi 			flags |= RENAME_EXCHANGE;
810e9be9d5eSMiklos Szeredi 			cleanup_whiteout = true;
811e9be9d5eSMiklos Szeredi 		}
812e9be9d5eSMiklos Szeredi 	}
813e9be9d5eSMiklos Szeredi 
814e9be9d5eSMiklos Szeredi 	old_upperdir = ovl_dentry_upper(old->d_parent);
815e9be9d5eSMiklos Szeredi 	new_upperdir = ovl_dentry_upper(new->d_parent);
816e9be9d5eSMiklos Szeredi 
817e9be9d5eSMiklos Szeredi 	trap = lock_rename(new_upperdir, old_upperdir);
818e9be9d5eSMiklos Szeredi 
819e9be9d5eSMiklos Szeredi 	olddentry = ovl_dentry_upper(old);
820e9be9d5eSMiklos Szeredi 	newdentry = ovl_dentry_upper(new);
821e9be9d5eSMiklos Szeredi 	if (newdentry) {
822e9be9d5eSMiklos Szeredi 		if (opaquedir) {
823e9be9d5eSMiklos Szeredi 			newdentry = opaquedir;
824e9be9d5eSMiklos Szeredi 			opaquedir = NULL;
825e9be9d5eSMiklos Szeredi 		} else {
826e9be9d5eSMiklos Szeredi 			dget(newdentry);
827e9be9d5eSMiklos Szeredi 		}
828e9be9d5eSMiklos Szeredi 	} else {
829e9be9d5eSMiklos Szeredi 		new_create = true;
830e9be9d5eSMiklos Szeredi 		newdentry = lookup_one_len(new->d_name.name, new_upperdir,
831e9be9d5eSMiklos Szeredi 					   new->d_name.len);
832e9be9d5eSMiklos Szeredi 		err = PTR_ERR(newdentry);
833e9be9d5eSMiklos Szeredi 		if (IS_ERR(newdentry))
834e9be9d5eSMiklos Szeredi 			goto out_unlock;
835e9be9d5eSMiklos Szeredi 	}
836e9be9d5eSMiklos Szeredi 
837e9be9d5eSMiklos Szeredi 	err = -ESTALE;
838e9be9d5eSMiklos Szeredi 	if (olddentry->d_parent != old_upperdir)
839e9be9d5eSMiklos Szeredi 		goto out_dput;
840e9be9d5eSMiklos Szeredi 	if (newdentry->d_parent != new_upperdir)
841e9be9d5eSMiklos Szeredi 		goto out_dput;
842e9be9d5eSMiklos Szeredi 	if (olddentry == trap)
843e9be9d5eSMiklos Szeredi 		goto out_dput;
844e9be9d5eSMiklos Szeredi 	if (newdentry == trap)
845e9be9d5eSMiklos Szeredi 		goto out_dput;
846e9be9d5eSMiklos Szeredi 
847e9be9d5eSMiklos Szeredi 	if (is_dir && !old_opaque && new_opaque) {
848e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(olddentry);
849e9be9d5eSMiklos Szeredi 		if (err)
850e9be9d5eSMiklos Szeredi 			goto out_dput;
851e9be9d5eSMiklos Szeredi 	}
852e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && old_opaque && !new_opaque) {
853e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
854e9be9d5eSMiklos Szeredi 		if (err)
855e9be9d5eSMiklos Szeredi 			goto out_dput;
856e9be9d5eSMiklos Szeredi 	}
857e9be9d5eSMiklos Szeredi 
858e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
859e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(old_upperdir->d_inode, olddentry,
860e9be9d5eSMiklos Szeredi 				    new_upperdir->d_inode, newdentry,
861e9be9d5eSMiklos Szeredi 				    flags);
862e9be9d5eSMiklos Szeredi 	} else {
863e9be9d5eSMiklos Szeredi 		/* No debug for the plain case */
864e9be9d5eSMiklos Szeredi 		BUG_ON(flags & ~RENAME_EXCHANGE);
865e9be9d5eSMiklos Szeredi 		err = vfs_rename(old_upperdir->d_inode, olddentry,
866e9be9d5eSMiklos Szeredi 				 new_upperdir->d_inode, newdentry,
867e9be9d5eSMiklos Szeredi 				 NULL, flags);
868e9be9d5eSMiklos Szeredi 	}
869e9be9d5eSMiklos Szeredi 
870e9be9d5eSMiklos Szeredi 	if (err) {
871e9be9d5eSMiklos Szeredi 		if (is_dir && !old_opaque && new_opaque)
872e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(olddentry);
873e9be9d5eSMiklos Szeredi 		if (!overwrite && new_is_dir && old_opaque && !new_opaque)
874e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(newdentry);
875e9be9d5eSMiklos Szeredi 		goto out_dput;
876e9be9d5eSMiklos Szeredi 	}
877e9be9d5eSMiklos Szeredi 
878e9be9d5eSMiklos Szeredi 	if (is_dir && old_opaque && !new_opaque)
879e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(olddentry);
880e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && !old_opaque && new_opaque)
881e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(newdentry);
882e9be9d5eSMiklos Szeredi 
883e9be9d5eSMiklos Szeredi 	if (old_opaque != new_opaque) {
884e9be9d5eSMiklos Szeredi 		ovl_dentry_set_opaque(old, new_opaque);
885e9be9d5eSMiklos Szeredi 		if (!overwrite)
886e9be9d5eSMiklos Szeredi 			ovl_dentry_set_opaque(new, old_opaque);
887e9be9d5eSMiklos Szeredi 	}
888e9be9d5eSMiklos Szeredi 
889e9be9d5eSMiklos Szeredi 	if (cleanup_whiteout)
890e9be9d5eSMiklos Szeredi 		ovl_cleanup(old_upperdir->d_inode, newdentry);
891e9be9d5eSMiklos Szeredi 
892e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(old->d_parent);
893e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(new->d_parent);
894e9be9d5eSMiklos Szeredi 
895e9be9d5eSMiklos Szeredi out_dput:
896e9be9d5eSMiklos Szeredi 	dput(newdentry);
897e9be9d5eSMiklos Szeredi out_unlock:
898e9be9d5eSMiklos Szeredi 	unlock_rename(new_upperdir, old_upperdir);
899e9be9d5eSMiklos Szeredi out_revert_creds:
900e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
901e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
902e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
903e9be9d5eSMiklos Szeredi 	}
904e9be9d5eSMiklos Szeredi out_drop_write:
905e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
906e9be9d5eSMiklos Szeredi out:
907e9be9d5eSMiklos Szeredi 	dput(opaquedir);
908e9be9d5eSMiklos Szeredi 	return err;
909e9be9d5eSMiklos Szeredi }
910e9be9d5eSMiklos Szeredi 
911e9be9d5eSMiklos Szeredi const struct inode_operations ovl_dir_inode_operations = {
912e9be9d5eSMiklos Szeredi 	.lookup		= ovl_lookup,
913e9be9d5eSMiklos Szeredi 	.mkdir		= ovl_mkdir,
914e9be9d5eSMiklos Szeredi 	.symlink	= ovl_symlink,
915e9be9d5eSMiklos Szeredi 	.unlink		= ovl_unlink,
916e9be9d5eSMiklos Szeredi 	.rmdir		= ovl_rmdir,
917e9be9d5eSMiklos Szeredi 	.rename2	= ovl_rename2,
918e9be9d5eSMiklos Szeredi 	.link		= ovl_link,
919e9be9d5eSMiklos Szeredi 	.setattr	= ovl_setattr,
920e9be9d5eSMiklos Szeredi 	.create		= ovl_create,
921e9be9d5eSMiklos Szeredi 	.mknod		= ovl_mknod,
922e9be9d5eSMiklos Szeredi 	.permission	= ovl_permission,
923e9be9d5eSMiklos Szeredi 	.getattr	= ovl_dir_getattr,
924e9be9d5eSMiklos Szeredi 	.setxattr	= ovl_setxattr,
925e9be9d5eSMiklos Szeredi 	.getxattr	= ovl_getxattr,
926e9be9d5eSMiklos Szeredi 	.listxattr	= ovl_listxattr,
927e9be9d5eSMiklos Szeredi 	.removexattr	= ovl_removexattr,
928e9be9d5eSMiklos Szeredi };
929